ChatGPT中文站
AI sometimes feels like I’m piloting an overpowered but complicated giant mecha. Image generated by NovelAI.

用Fine Tuning技术在生成AI周围建立品牌堡垒

如果每个人都在使用生成式人工智能,品牌如何能够区别自己?在一篇VentureBeat文章中,研究人员对模型崩溃表示担忧:一种情况是互联网被充斥着由人工智能生成的内容,这些内容又被反馈到生成式人工智能中,从而使其与现实越来越脱节。

为了在一定程度上解决这个问题,之前我分享了如何利用专业知识以及有意识地使用提示来帮助解决。在这里,我将进一步进行:微调内部模型。

市场营销中的AI采用成熟度

我个人认为,大多数市场团队应该从内部使用开始,因为这样可以使团队熟悉生成性人工智能,并在正式推出之前能够审核其输出。在此之后,可以为面向消费者的人工智能建立基准和评估流程。以下是我对市场营销人员如何在不久的将来看待生成性人工智能的看法:

  • 阶段1:早期采用 — 使用现成的解决方案,如ChatGPT,Adobe Firefly或Jasper,以增强或自动化常规任务,例如头脑风暴,SEO关键词生成,元数据创建,内容审核,总结和重新利用。
  • 阶段2:品牌丰富化 — 部署通过第一方内容,例如信息指南、品牌手册、活动简报、市场研究、销售介绍、营销内容和行业知识等丰富的模型。这样可以确保与品牌声音和产品领域一致的差异化营销传播。
  • 第三阶段:AI驱动的营销-该品牌设定了生成式AI的基准,并定期更新其数据和参数,以在市场动态中实现这些基准。生成式AI成为活动和情感分析、受众细分和营销战略的第一个接触点。

大多数营销人员目前处于早期采用阶段,使用生成式人工智能来执行例行任务。之后,他们将面临两个问题。

一个是深度。通常,生成式人工智能模型是通过公共来源的数据进行训练的,这可能导致上下文不足。另一个是一致性。可能需要进行大量的提示整理,以生成符合品牌形象和要求的东西...如果使用生成式人工智能模型,这可能都是可能的,因为这些模型被设计用于更广泛的应用。

AI细调可以解决这两个问题。创建一个捕捉品牌及其产品或服务细微差别的专有数据集,可以为生成式AI模型提供独特的背景和深度。此外,输出结果将更符合品牌的定位和语义。

基本上,由于生成式人工智能的采用率将在各个品牌间接近平等,第一方数据就成为品牌的壕沟。

微调一个大型语言模型

生成式人工智能生态系统迅速成熟,因此商业模型如ChatGPT,开源模型如Meta的Llama 2和TII的Falcon都可以进行轻微或无需编程的微调。

这曾经是昂贵的,但最近的发展使得微调变得更快速和硬件压力更小。用微软的LoRA(大型语言模型的低秩适应)的话来说:

与使用Adam进行微调的GPT-3 175B相比,LoRA可以将可训练参数的数量减少10,000倍,并将GPU内存要求减少3倍。

从视觉上来说,微调改变了模型的这样:

ChatGPT中文站
Most of the foundational model’s information is retained. Fine tuning changes the words it prioritizes before answering.

通过微调获得的主要效果是扩展的知识和语言风格的变化。Scott Galloway的ProfG.ai是行之有效的微调的很好例子,他通过使用自己的作品来训练模型,使其听起来像他自己一样。

随着生态系统的大幅精简,模型的微调工作大部分需要在之前和之后进行。也就是说:

  1. 准备训练数据集。对现有数据进行审计,定义一个框架和分类体系对其进行结构化,并根据该框架进行筛选和标记相关示例。清楚了解品牌的信息传递、语调、价值观、定位、受众偏好、产品和服务特点、优势、独特卖点和关键差异是至关重要的。
  2. 选择最佳的精调模型。定义成功并调整数据和参数以实现成功。

为了研究微调的效果,我策划了一个包含超过100篇文章的数据集,这些文章来自Accenture、Bain、德勤、Kantar和麦肯锡,标有日期和发布者,涵盖了今年的商业挑战、生成式人工智能、技术和创新等主题。然后,我使用Hugging Face的Supervised Fine-tuning Trainer来训练Meta的Llama 2 13b Chat变体,并将其暴露在咨询内容和商业主题的专业风格中。以下是我的研究结果。

数据标注的影响

数据标注结合提示中的关键词能够提供最新信息并进行比较。我询问了ChatGPT对于生成型人工智能采用的影响,并且没有进行精调,原版的Llama 2提供了一个推测的列表。毕竟它的截止日期是2022年12月。

ChatGPT中文站
Vanilla Llama 2 gave a long but speculative answer.

在对其进行微调后,由于我提到了“McKinsey”和“Accenture”等出版商 的名称,Llama 2能够准确比较每家咨询公司的观点。例如,提到了 McKinsey如何观察到ChatGPT在医疗、金融和客户服务方面的采用,而Accenture则确定了其他因素,如计算机视觉和自然语言处理。

ChatGPT中文站
Fine-tuned Llama 2 was concise but mentioned more specifics, such as validation, increased investments and the availability of datasets.

进一步推断,数据标签有着许多潜在的营销数据集应用。例如,通过市场进行标注可以在本地化和细分领域做出更加明智的决策,而通过媒体渠道或受众人口统计数据进行标注可以为目标定位和适应策略提供信息。

生成式人工智能甚至可以用于创建这些标签,例如分析评论或客户支持信息以识别或更新客户群体。

扩展的知识

精细调整还进一步拓宽了Llama 2在我策划的领域知识上的深度。在精细调整之前,Llama 2对生成式人工智能采用中领域知识的角色给出了一个不太细致入微的观点。

ChatGPT中文站
Vanilla Llama 2 answered in layperson’s terms, using analogies.

在进行精细调整后,它能够详细阐述特定的业务应用和挑战,例如在医疗和金融领域,同时还能谈论伦理和偏见。

此更改是由于LLM最终检索学习数据的方式所致。在这种情况下,优先考虑最近学习的业务内容。对于营销来说,这种能力也可以应用于品牌关键信息、产品特点和领域专业知识。

ChatGPT中文站
Fine-tuned Llama 2 focuses on the business side.

保持 HTML 结构,将以下英文文本翻译为简体中文: 在营销团队中,我经常看到一个重复出现的挑战,那就是新成员、代言人或代理商的入职。在从营销和定位角度了解品牌、了解产品类别内的微妙问题以及需要进行 360 度推广的创意技能之间,这可能让人不知所措。内部人工智能模型可以帮助简化入职流程,并确保团队之间的一致性。

语言风格的变化

默认情况下,Llama 2的聊天变体是针对会话语言进行微调的。以下是微调如何改变其回答风格的示例。默认情况下,它可以非常表达力。

ChatGPT中文站
Not gonna lie, I like Vanilla Llama 2’s answer.

与此同时,经过精调的Llama 2听起来更加专业,使用了历史参考、提及了人类心理学甚至引用了特定的电影。

ChatGPT中文站
Fine tuned Llama 2’s use of references can be better for surfacing research hooks.

准确性问题

我需要强调细调有提到“细”,因为它是一个精细的过程,试图在学习新信息的同时不忘记模型的基础知识。由于我只使用了大约100篇文章并在训练器上运行了20个周期,该模型可以学习广泛的概念和改变其写作风格,但可能难以回忆特定报告中的具体统计数据。

ChatGPT中文站
No it’s not 3.4%.

鉴于事实准确性,我建议使用检索增强生成技术,因为它直接从源头获取信息,比如产品说明书。这样做可以更轻松地进行微调,以更好地保留模型的基础知识和创造力。

微调的LLM在行动中

这是一个关于LLM优化模式下运行原理的内部信息窥视:

ChatGPT中文站
Pretty accurate, though some refinement is needed.

我能描述这个的最佳方式是混合写作。我提供背景并引导对话朝某个方向发展,然后点击生成按钮,看看语言模型与我观点是否相同或不同。这可以帮助我发现原本忽视的想法,尽管表达上可能有相当多的行话。

正如你所看到的,这篇文章的最终版本看起来非常不同。

外卖

我仍然坚持今年年初的断言:人工智能还不能取代人类。

虽然如此,越来越明显的是人工智能可以简化现有流程并加速创意的发展。鉴于细化的机会,下面是我的预测和建议:

  1. 市场营销需要专注。市场营销人员需要有意识地了解品牌的代表意义、如何表达以及受众是谁。首先,没有这些,将很难在大量的通用内容中脱颖而出。其次,这将为品牌塑造了一个固有的优势,并为内部法学硕士提供清晰的指导方向。
  2. 每家公司都将成为一个数据公司。由于广告生态系统的发展,对于第一方数据已经有了强劲的推动力。利用生成式人工智能,更多的数据反映了营销目标,无论是目标细分、本地化、品牌认知、广告效应或其他衡量指标,越多的人工智能可以通过其标记的数据来筛选出正确的答案。
  3. 近期的趋势是增强决策。人工智能无法取代人类,但在某些任务上比人类更优秀。在研究和构思阶段,它能够比人类更快地浏览历史数据。在生产过程中,它能够快速生成和迭代概念,并帮助解决创造性障碍。它也非常适合提供反馈意见。

换句话说,由于每个人都可以使用ChatGPT,区别在于首先是才能,其次是数据质量。按照这个顺序。

用通俗的语言解释

感谢您成为我们社区的一员!在您离开之前:

  • 请务必鼓掌并关注作者!👏
  • 您可以在PlainEnglish.io找到更多内容🚀
  • 注册我们的免费每周新闻简报。🗞️
  • 保持HTML结构,将以下英文文本翻译为简体中文: 关注我们的Twitter账号(X),领英(LinkeIn)、油管(YouTube)和Discord。

2023-10-20 17:18:54 AI中文站翻译自原文