SaaS AI 功能满足无护城河的应用程序

最近,几家企业级SaaS公司宣布了生成式人工智能功能,这对于缺乏可持续竞争优势的人工智能创业公司来说是一个直接威胁。

七月份,我们深入研究了Y Combinator的W23批次中的生成AI初创公司 - 具体来说,是利用像GPT这样的大型语言模型(LLMs)的初创公司,GPT是ChatGPT的动力源。我们确定了这些初创公司的一些重要趋势 - 如专注于非常具体的问题和客户(例如针对中小企业的营销内容),与现有软件的集成(例如与Salesforce这样的CRM平台集成),能够为特定场景定制大型语言模型(例如公司品牌的语音)。

文章中没有太多讨论的第二个方面是关于壕沟风险的,援引当时的话:

其中几家初创企业存在一个主要风险,即潜在的长期壕沟不足。考虑到这些初创企业的阶段和有限的公开信息,对此不宜过分解读,但对它们的长期防御能力提出质疑并不困难。例如:

如果一家创业公司建立在以下前提的基础上:采用像 GPT 这样的基本 LLMs(大型语言模型),并将其集成到帮助台软件中,以理解知识库和写作风格,然后生成初稿回复,那么是什么阻止了一个帮助台软件巨头(如 Zendesk、Salesforce)复制这个功能并将其作为其产品套件的一部分提供?

如果一家初创公司正在为一个文本编辑器构建一个帮助内容生成的酷炫界面,那么什么阻止谷歌文档(已经在尝试自动草稿功能)和微软Word(已经在尝试Copilot工具)复制这一点呢?进一步说,是什么阻止它们提供一个质量比原产品差25%的产品,并在现有产品套件中免费提供(比如微软Teams占领Slack的市场份额)?

这正是在过去几个月中所发生的情况。几家大型企业SaaS公司宣布并/或推出了他们的生成式人工智能产品——Slack、Salesforce、Dropbox、Microsoft和Google等等。这对于那些正在为企业客户构建有用的生产力应用程序的生成式人工智能初创公司来说,是一个直接的威胁,因为它们具有有限的可持续竞争优势(即没有护城河)。在本文中,我们将深入探讨:

  • AI价值链概述
  • 企业SaaS公司的最新AI功能
  • 在这种环境下,创业公司如何构建护城河

AI价值链回顾

我们不会花太多时间在这上面,但要快速提醒一下,思考公司如何从人工智能中获得价值的一个方法是通过AI价值链的概念。具体而言,你可以将价值链分为三个层次:

  • 基础设施(例如:负责运行人工智能应用的NVIDIA芯片制造商、为人工智能提供云计算的亚马逊AWS、为产品构建提供大型语言模型(如GPT)的Open AI)
  • 平台(例如,Snowflake提供了基于云的解决方案,可以在一个地方管理您所有的数据需求,从导入到清理再到处理)
  • 应用程序(例如,帮助中小型企业快速创建营销内容的创业公司)
  • ChatGPT中文站
    AI value chain; Source: author

尽管生成式人工智能浪潮始于OpenAI推出的ChatGPT,并以GPT模型(基础架构层)为其动力,但越来越明显的是,基础架构层正在商品化,一些大型参与者正在市场上推出自己的语言模型,其中包括Facebook的LLaMA、Google的LaMDA和Anthropic等。商品化的原因在于这些模型大部分都是使用相同的公开可用数据集进行训练(例如CommonCrawl用于爬取互联网上的网站以及维基百科)。

除了这个数据池之外,每个拥有大量第一方数据库的大公司都在将数据用于自身或者创建许可模式,这意味着这些数据要么不可获得,要么对所有模型提供商用于训练是可获得的,即商品化。这与云计算市场上的情况类似,在那里亚马逊AWS、微软Azure和谷歌云现在占据了大部分市场份额,但彼此之间也进行了激烈的竞争。

尽管平台层次相对较少被市场商品化,但还有可能有更多的参与者以满足各种客户需求(例如初创公司、中小型企业和大型企业客户)。然而,它正朝着商品化的方向发展,大型参与者开始加强他们的产品和服务(例如数据仓储平台Snowflake最近收购了Neeva,以为企业提供LLM应用,分析平台Databricks收购了MosaicML,为他们的客户提供生成式人工智能能力)。

因此,大多数人工智能价值将在应用层产生。然而,一个未解之谜是哪些公司有可能受益于大型语言模型(如GPT)解锁的应用程序。令人不惊的是,在Y Combinator的W23批次中,269家初创公司中,约31%报告自己具有人工智能标签。虽然这些应用程序在客户端中都是客观有用的并为他们的客户创造价值,特别是在企业级SaaS领域,但越来越清楚的是,现有的SaaS公司在从人工智能中获得利益方面处于更好的位置。

最近企业SaaS公司的AI功能

最近几周,SaaS公司纷纷发布了一系列公告。让我们来看几个例子。

Slack最初通过支持ChatGPT机器人在您的Slack工作区内运行,既可以对主题进行总结,也可以帮助起草回复。很快,这一功能扩展到支持Claude机器人(Claude相当于Anthropic的GPT模型)。更重要的是,Slack宣布在应用程序内部建立了自己的生成式AI,这支持对主题和频道进行广泛的总结功能(例如,告诉我今天在这个频道发生了什么,告诉我项目X的情况)。本来可以由初创公司开发的插件现在成为了Slack内置的本地功能,因为Slack可以轻松获取像GPT这样的模型并构建生成式AI功能。这并不是非常困难的事情,而且还可以使Slack免受处理集成/来自未知插件的笨拙用户体验的麻烦之处。

另一项来自Salesforce的公告宣布了他们的产品Einstein GPT,将其定位为CRM的生成式人工智能。它将使Salesforce用户能够查询各种事物(例如,现在谁是我的主要潜在客户),自动生成和迭代电子邮件草稿,甚至根据这些查询创建自动化工作流程。很可能这个功能在截图中看起来比实际情况要好,但是可以肯定的是,Salesforce有能力在一年内构建一个相当无缝的产品。实际上,一些生成式人工智能创业公司正在开发的正是这种功能。虽然在短期内有用,但这些创业公司的成功不仅取决于是否比Einstein GPT更好,还取决于是否比它好得多,以至于企业级SaaS买家愿意承担引入新产品的摩擦(我不会在我的评论中点名这些创业公司,因为从零开始构建产品是困难的,而写评论则较容易)。

在类似的思路上,Dropbox宣布了一个名为Dropbox Dash的产品,定位为由人工智能驱动的通用搜索。它支持多种功能,包括从Dropbox存储的所有文档中获取问答解答、总结文档内容,以及回答文档内容中的具体问题(例如,合同何时到期)。同样,今天有一些生成型人工智能初创公司正在逐步构建这些功能,而Dropbox则因为已经能够访问到所需的数据并能够在其产品中创建无缝的界面,因此在长期成功方面具备更为便捷的路径。

列表继续:

  • Zoom宣布推出Zoom AI,提供会议摘要、会议中回答问题(如果你错过了一部分并想要追赶进度),以及总结聊天记录。如今,一些初创公司正在构建这些功能作为单独的产品(例如,笔记工具)。
  • Microsoft 365联席驾驶员将阅读您未读的电子邮件并总结内容,回答您所有文档中的问题,并撰写各种文件等等。这些功能还将无缝嵌入Word、Excel、OneNote和OneDrive等产品的界面中。
  • Google在他们的生产力套件中有一个名为Duet AI的类似产品。
  • 即使OpenAI(虽然不是主导型SaaS公司)也推出了ChatGPT企业版,可以基本上与公司的所有工具连接,并为员工的任何问题提供简单答案。

我绝不是说战斗已经结束。如果你迄今为止使用过任何生成式人工智能产品,可能会有一些惊叹的时刻,但更多的时候可能会感觉一般。上述产品的宣传很吸引人,但其中大部分要么只是试点运营,要么只是产品未来状态的新闻公告。

还存在一些未解决的问题限制了这些产品的采用。定价参差不齐,一些产品为了竞争而免费提供人工智能功能,而其他更广泛的协作产品则按每个座位收费。微软365协作的价格为每用户每月30美元,ChatGPT企业版约为每用户每月20美元 - 尽管对消费者来说这似乎可以接受,但对于一些企业购买者来说,尤其是考虑到成本快速累积到数千名员工的情况下,他们可能会觉得这个价格可笑。数据共享考虑是另一个重要的阻碍因素,因为企业在与语言模型共享敏感数据时存在犹豫(尽管企业AI产品明确表示他们不会将客户数据用于训练目的)。

话虽如此,这些是可以解决的问题,大型软件即服务(SaaS)公司专注于构建人工智能功能,意味着这些问题将近期得到解决。这就将我们带回到壕沟问题——基于企业客户的生成式人工智能初创公司需要找到强大的壕沟,以便在面对SaaS巨头的人工智能功能时继续蓬勃发展。

如何在这种环境下创业公司建立护城河

让我们从明显的非壕沟开始:拿起大型语言模型,并在其之上构建一个小的价值主张(例如,改进用户界面,插入一个数据源)并不能创造长期可持续的优势。这些相当容易被模仿,即使你具有先行者优势,你要么会输给一家现有企业(他们能更轻松地接触到数据,或对接口更灵活),要么陷入价格战的泥潭。

以下是保护企业人工智能产品的一些非详尽方法。

1. 领域/垂直专长

一些领域/垂直行业比其他领域更适合构建人工智能应用。例如,基于CRM软件进行开发非常难以捍卫,因为像Salesforce这样的CRM公司既拥有数据连接,又能更好地控制接口。你可以提出非常聪明的创新(例如,利用CRM数据创建Linkedin插件来自动起草外联邮件),但创新者/先占市场的角色并不总是赢得市场。

法律是人工智能初创企业可以大放异彩的一个领域的一个例子。法律文件往往很长,需要大量的时间来阅读,对每个参与者而言都是一个令人沮丧的过程。对合同进行概括/分析、从合同内容中提供问答、概述法律论点、从文件中提取证据等都是耗时的任务,这些任务可以由法学硕士(LLM)来有效地完成。Casetext、Harvey.ai是一些为律师提供协作产品的初创公司,它们构建了专门满足法律使用场景的定制体验。

在医疗保健中,另一个迫切需要效率提升的垂直行业。AI在医疗保健领域的部署面临着几个挑战,包括数据隐私/敏感性问题、复杂的软件(企业资源规划,排班工具等)之间的复杂网状结构以及大型医疗保健产品制造公司的技术深度/灵活性不足。这些对于初创企业来说是明显的机会,可以迅速推出产品,并利用市场先占地位作为竞争壁垒。

2. 数据/网络效应

机器学习模型(包括大型语言模型)的表现与其训练所使用的数据量成正比。这是为什么谷歌搜索是全球最为高效的搜索引擎之一的主要原因之一,不仅仅是因为谷歌拥有全球所有网页的索引(其他搜索引擎也有),而是因为数十亿人使用该产品,并且每个用户交互都是该搜索相关性模型的数据点。

然而,企业产品面临的挑战在于企业客户将明确禁止SaaS或AI软件提供商使用他们的数据进行训练(并且这样做是正确的)。企业拥有大量的敏感信息-从客户数据到公司战略数据-他们不希望将这些数据输入到OpenAI或Google的大型语言模型中。

因此,构建一个环绕防御圈的难度较大,但在某些情况下仍然是可能的。例如,由人工智能工具生成的广告或营销目的的内容较为敏感,企业更有可能允许使用这些数据来改进模型(从而提升自身的业绩)。另一种方法是提供一个非企业版本的产品,其中使用数据默认选择用于训练 — 个人和中小型企业用户更可能接受这种方法。

3. 引入多个数据来源

将大型语言模型应用于特定企业用例的最困难部分不是从架子上选择一个模型并部署它,而是构建必要的管道,将公司的相关数据集引导给模型访问。

假设你是像 Intuit 这样的大公司,为中小型企业销售会计和税务软件。您支持数以万计的中小企业客户,当其中一位客户向您寻求支持时,您希望能够提供个性化的回复。很可能,该客户使用的产品的数据存储在一个内部数据库中,客户与产品的最新交互数据存储在另一个数据库中,而他们过去的支持问题历史存储在一个帮助台 SaaS 产品中。生成式人工智能初创企业建立壕沟的一种方法是通过确定需要多个数据源的特定用例,而这些数据源并不由单个大型 SaaS 供应商拥有,并进行集成以传输这些数据。

这在其他情境下非常成功——例如,整个客户数据平台市场的出现是为了从多个来源获取数据,以便对客户拥有一个集中的视图。

4. 数据孤立化

大企业不想将敏感数据暴露给模型,尤其是那些由竞争对手拥有或在市场上具有太大影响力的公司所拥有的模型(即由于缺乏替代选择而被企业强制共享数据的公司)。

从YC W23的文章中可以得知,CodeComplete是一个很好的例子,它是从这个痛点中崛起的公司。

在 Meta 公司时,CodeComplete 的创始人尝试使用 GitHub Copilot,但由于数据隐私考虑,他们的请求在内部被拒绝。现在的 CodeComplete 是一款人工智能编码助手工具,经过精细调整以适应用户自己的代码库,以提供更相关的建议,并且模型直接部署在用户自己的本地或云端。

建立一个更完整的产品

基于以上所有理由,我个人对大部分独立的人工智能应用有长期壕沟潜力的企业持怀疑态度,特别是那些针对企业客户的应用。虽然市场先发优势确实是一种策略,并且可能是快速收购的好路径,但唯一真正能够构建强大壕沟的方式是打造更完整的产品。

专注于为营销提供AI文案撰写的公司总是面临被更大的营销工具(比如营销云或来自像谷歌/美塔(Meta)这样的平台的创意生成工具)取代的风险。而在CRM或帮助台工具之上构建AI层的公司很可能会被现有的SaaS公司模仿。

解决这个问题的方法是构建一个更完整的产品。例如,如果目标是为了实现更好的营销内容创作,一个更完整的产品应包括解决核心用户问题的平台(例如,创建内容所需的时间,创建多个尺寸的内容),并且还应包括强大的生成式人工智能功能集(例如为Instagram生成最佳视觉效果)。

结论

我对产生性AI所能释放的生产力数量感到兴奋。虽然我个人迄今为止尚未出现大幅度的生产力跃升,但我相信在近中期之内,这种情况将迅速发生。鉴于基础设施和平台层正在逐渐变得合理化,从AI提供的生产力中获得的最大价值将由应用层的产品所捕获。尤其是在企业产品领域,我认为大量价值将被现有的SaaS公司所捕获,但我对新的更完整的产品,具备AI前沿功能集和因此产生实质性护城河的产品持乐观态度。

🚀 如果您喜欢这篇文章,请考虑订阅我的周报《解密》。每周,我会发表一篇针对当前科技话题/产品战略的深度分析文章,阅读时间约为10分钟。最好的祝福,Viggy。

2023-10-20 17:21:45 AI中文站翻译自原文