生成式人工智能的真实影响:超越炒作周期

为什么你现在应该利用生成式人工智能促进业务增长,并保持领先位置对手。

介绍

ChatGPT 在 2022 年12 月份发布,引爆了生成式人工智能(Gen AI)的热潮。这一突破推动了各公司竞相开发日益先进的大型语言模型(LLMs),包括多模态模型在内。初创公司蓬勃发展,利用这些LLMs的增强功能构建产品。大型公司(如NVIDIA、云服务提供商,甚至手机和笔记本电脑制造商)正纷纷投资于Gen AI,以避免错失可能成为未来客户的早期采用者。各行各业都急于抓住这股创新浪潮。

加特纳炒作周期及其危险

随着任何新技术的出现,总会有信徒和怀疑者。 加特纳技术成熟度曲线表明,新技术经历虚高期后会跌入“失望槽”。 许多人相信,人工智能已经经历了虚高期,并且即将跌落。 虽然技术成熟度曲线准确描述了许多新技术,但仅仅关注它可能会产生误导。

Gartner Hype Cycle — Where Gen AI is now

夸大的宣称通常源自狂热者、开发人员未能充分评估原型用例之外的局限性、或急于推广其平台的供应商,我称之为夸大者。因此,试图建立生产级系统的组织可能会遇到挑战,导致幻灭。

呆在场外的风险

这个博客提供了一个不同的视角:对于那些害怕由于炒作周期而过度投资,并选择等待和保持观望的组织的危险——怀疑论者。这个群体对于Gen AI能力的期望由灰色线条(怀疑论谬误)代表——非常低的期望,并最终随着许多组织分享成功故事,它开始在生产力高峰点追赶。

Skeptic fallacy and real capability curve

事实是... 并不是所有的能力都是炒作;相当大部分是真实的,提供可以随着时间而改善的实际好处。Gen AI的真实能力,由绿色曲线代表,足以提升业务运营,解锁新想法,增强流程,提高团队效率,改善客户体验。

更重要的是,这些能力足以扰乱和威胁企业,甚至是那些有效利用它们的较小竞争对手。

过度依赖炒作周期的组织可能会错过利用Gen AI真正潜力的机会,如果竞争对手已经利用这些技术,那么他们可能太迟了。这可以通过错失机会差距来表示(真实能力与他们现有的非Gen AI能力之间的差距)。

Missed out opportunity

如果您是那些对于投资Gen AI犹豫不决的人之一,这篇博客旨在鼓励您重新考虑,并专注于您现在可以利用的真实能力。

我的Gen AI体验

为了避免被贴上过度夸大的标签,让我分享一下我在这个博客中所基于的信息来源的经验。我领导一个AI部门,成功地打造并部署了三种基于LLM技术的面向消费者的技术,包括检索增强生成(RAG)。作为我们的AI治理委员会的一部分,我严格审查AI发展,尤其是由Gen AI支持的那些,确保安全和责任。我们的组织使用ChatGPT的团队许可证,这明显提高了员工的工作效率。

在接下来的博客中,我将分享Gen AI如何在四个领域已经带来了明显的好处的经验。

用简体中文翻译的文本:Gen AI 加速了人工智能的发展

Gen AI正在取代许多传统的NLP AI技术,提供更高的准确性、更短的开发时间以及显着减少的维护成本。例如,考虑从客户产品评论中检测流行主题和情绪。

Generative AI simplify many NLP tasks (Image generated with MidJourney)

传统上,数据科学家会花费数周时间收集和清理数据,将评论分成段落或句子,标记每个块,训练模型,并调整超参数。然后,机器学习工程师会花费额外的几周时间将模型投入生产,构建持续的培训管道,并维护系统。

使用Gen AI,特别是LLMs,这个过程会简化,并且成本至少可以降低三倍。

  • 数据收集和标记-数据科学家仍然收集和标记数据集,但主要是为了对比LLM提示。
  • 高效工程 — 他们进行快速工程迭代,评估提示与验证集,直到达到可接受的准确度。
  • 简化生产-将模型生产化变得更简单-基本上只需要调用LLM提供商的API。无需处理大型模型二进制文件或复杂的ML框架,大大减少了维护和基础设施成本。

经常情况下,LLM解决方案提供更高的准确性,因为它能够处理整篇评论而不会失去上下文 - 这是传统NLP技术的常见挑战。

在过去的六个月里,LLMs已经成为我们在许多NLP任务中的首选,如情感分析、实体提取(例如,品牌名称、地点的检测)和文本分类。这种转变极大地提高了我们的生产效率。

解决常见问题

  • 成本 — 尽管LLM的一些用例可能很昂贵,但有各种不同的尺寸可供选择,成本与尺寸成比例。您应该评估并选择符合您可接受准确度的最小型号。考虑到建设、生产和维护的人工成本时,LLM选项通常更具成本效益。
  • 速度 — LLMs 可能会比较慢,但选择适当的大小可以提高响应时间。此外,对于类似情感分析客户评价的应用,实时处理并不总是必要的。

有了节省的额外时间,您的团队可以通过构建更多的AI技术更好地支持您的业务。同样,您的竞争对手可能会以三倍的速度利用这种能力来构建AI解决方案。

使用Gen AI增强客户体验

Gen AI不仅提高了AI模型的准确性,还使您能够提供高度个性化的网站或应用体验。例如:

  • 亚马逊——推出了Rufus,一个聊天机器人,回答用户关于特定产品的问题,甚至比较像跑步鞋和登山鞋这样的物品。
  • 汽车销售-为汽车编辑文章实现了人工智能搜索功能,返回相关内容和直接答案(如果适用)。这导致点击率增加,并获得了积极的用户反馈。
  • carsales.com

用人工智能技能赋能软件工程师

在许多组织中,软件工程师数量超过数据科学家和机器学习工程师。有些组织可能根本没有数据科学家或机器学习工程师,这限制了他们构建人工智能技术的能力。

我是人工智能民主化的坚定支持者。虽然软件工程师可以接受培训成为公民数据科学家或机器学习工程师,但仍然存在一些障碍—比如许多人可能不精通Python和机器学习技术。

具有Gen AI技术,许多LLM使用情况涉及简单的API调用,可通过大多数编程语言中可用的框架进行访问。这种可访问性使软件工程师能够在评估LLM模型的正确指导下利用人工智能能力。

Generative AI is enabling many software developer (Image generated with MidJourney)

想象一下,当所有软件工程师都可以利用人工智能时,您可以获得的巨大能力和效率增益。同样,您的竞争对手可能已经通过利用现有的软件工程师更便宜地构建人工智能技术。

提高非技术团队的工作效率

Gen AI显著提高了非技术团队的生产力。虽然许多生产力工具像Jira,Microsoft Office Suite,Confluence和Miro都在集成Gen AI功能,但独立的聊天机器人工具像ChatGPT,Claude for Work或Perplexity.ai也非常有用。它们帮助团队成员执行任务,例如:

  • 总结长篇文件——快速提炼长篇报告中的重要信息。
  • 头脑风暴思路 — 产生创意概念或解决问题的方案。
  • 分析大型数据集 — 检查大量数据,如产品评论,无需等待专业团队。
  • 重述文档 - 为了清晰或不同的受众重新表述内容。
  • 进行市场研究 - 高效收集市场趋势和竞争对手的见解。
  • Gen AI is helping non technical team (Image generated with MidJourney)

我们的测试团队报告称,使用ChatGPT等工具可以使生产率提高超过5%。对于每月20美元的许可证费用,这对企业来说是一笔很高的投资回报。分析大型数据集等任务不再需要创建支持票并等待数据科学或分析团队,大大提高了效率。

然而,指南是必要的,以确保团队知道如何验证输出和实践有效的提示工程。你不想看到的最后一件事是基于LLM制作的不准确分析而做出的业务决策。

再次考虑到,您的竞争对手利用这些工具可能会提高超过5%的生产力。

总结

Gen AI不仅仅是炒作;它已经为企业带来了真正的商业价值。虽然夸大其词的声明很常见,但忽视其潜力可能会使组织面临风险。Gen AI加速了人工智能的发展,提升了客户体验,提高了生产效率超过5%,甚至让软件工程师能够更快地构建人工智能解决方案。创新的步伐迅速,每三个月就会翻倍(与2023年3月的原始GPT4相比,GPT4o现在便宜50倍)。通过低风险试点测试Gen AI是了解其潜力的最佳方式。

警惕很重要 - 尽管许多用例可能不直接面向客户,因此对安全性的强调较少,但面向客户的聊天机器人在提供误导性答案时需要严格的安全措施,以防止声誉受损。建立强大的人工智能治理和数据验证实践可以帮助减轻这些风险,我将在未来的博客中进行详细介绍。然而,采取行动的风险更大,因为观望可能会使您的业务易受已经利用Gen AI强大功能的竞争对手的攻击。在这个快速发展的领域中,平衡警惕与创新是蓬勃发展的关键。

如果您喜欢这篇博客,请用大量掌声表示支持。

要联系我,请随意在LinkedIn上添加我。要查看更多我的文章,请在Medium上关注我。

2024-10-12 04:22:20 AI中文站翻译自原文