AI工作区和功能调用
这些是从单人通用使用过渡到在工作场所广泛商业采用的LLM的关键驱动因素 - 但它们是什么,谁支持它们?
让我们首先定义这些概念,并统一术语:
- AI工作空间:一键式AI环境,支持自定义指令、资源和聊天记录,专注于特定主题或领域。常用于团队协作。 - 又称:GPTs、自定义GPTs、项目、空间、游乐场和应用。
- 功能调用:当LLM对某个事件作出反应或生成响应时,具有通过API请求第三方服务的能力。也称为:操作、工具使用、自定义操作和GPT操作。
LLMs向广泛的工作场所采用的过渡
每周,我都会见到人们和团队— 有时是那些不处于技术采纳前沿的人— 他们正在在Chat GPT中设置自己的自定义GPT。 他们输入他们准备好的最佳文档,然后使用这些工作空间来起草电子邮件,创建品牌文字并帮助撰写新文档。
自定义的GPT已经成为AI工作空间的最显著例子,它们可能是将LLM使用从单一玩家、通用用例转变为在工作场所广泛、商业驱动使用的最关键因素。
同样关键的是过渡过程中的函数调用,它们使LLM能够从结构化数据源中获取信息,或者直接代表用户与第三方系统进行交互。虽然在使用基础模型提供者的API构建的自定义工具中,函数调用已经开始流行起来,但在AI工作空间中使用函数调用还处于初始阶段,我们预计在未来几个月会看到更多这种结合的情况。
这种强大组合的一个例子是我们如何在GRID将电子表格带入定制GPTs,弥合了这一差距,使电子表格和电子表格计算对LLMs可用。
谁做什么,用什么名字?
所有信息截至2024年10月28日编写。
ChatGPT 聊天GPT
OpenAI 擅长很多事情,但取名并不是他们擅长的领域。
官方上,OpenAI将ChatGPT的AI Workspaces简称为GPTs(请参见原始公告),但大多数用户将其称为自定义GPTs。 GPTs支持文件上传,对文本文件、图像和表格数据格式进行了优化处理。用户还可以在GPTs的说明中指定网站URL,使模型可以将这些网站的内容合并到回复中。
在自定义GPT中,功能调用被称为Actions,而在OpenAI的API平台(聊天完成API、助手API和批量API)中,它被简单地称为函数调用。
- 人工智能工作空间:GPTs,我的GPTs,定制GPTs
- 在AI工作区中的功能调用:操作、GPT操作或自定义操作
- 平台中的函数调用: 函数调用
克劳德
克劳德的AI工作空间被称为项目。 项目仅限于上传的文本文档和直接输入的文本。 它们无法包含网站URL。
Claude的项目不支持函数调用。但在Claude更广泛的平台上,支持函数调用,称为工具使用。
- 人工智能工作区:项目
- 在AI工作区中的函数调用:不支持
- 平台中的功能调用: 工具使用
Google 谷歌
在过去的两年里,谷歌在LLM领域探索了许多方法。一个值得注意的项目,可以被视为人工智能工作区,就是NotebookLM。 NotebookLM接受各种来源:上传的文件、谷歌云端硬盘中的文件和来自网站链接的文本。它有效处理文本文档和图像,令人印象深刻的是,还能处理视频和音频文件。
笔记本LM不支持函数调用,但谷歌的Gemini平台支持。
- 人工智能工作区:笔记本LM
- 在AI工作区中不支持函数调用
- 在平台中调用函数: 函数调用
黏合
Cohere专注于企业解决方案,因此他们的默认操作模式是作为AI工作区。他们提供一系列部署选项,但您可以通过他们的仪表板上的聊天或游乐场来测试他们的产品。该平台接受文本文件,并可以根据指定的域配置访问网络内容。
Cohere的功能调用能力,称为工具使用,允许与外部工具进行交互。在游乐场中,只有一些预先构建的工具可用,但在完整部署中,客户可以使用Cohere的聊天API定义自己的工具。
- AI工作空间:默认操作模式,可通过聊天或游乐场进行测试。
- 功能调用:工具使用
获取
与Cohere一样,Glean专注于企业,具有默认设置,可作为AI工作区。此外,Glean还可以让用户创建具有专用来源和说明的自定义应用程序,有效地允许在平台设置中进一步定制AI工作区。
该平台支持函数调用,称为“动作”,可以在自定义应用程序和整个平台中访问。
- AI工作空间:默认操作模式,并进一步细分为应用程序
- 功能调用: 操作
困惑
Perplexity 将自己定位为 AI 搜索引擎,与通用 LLMs 相比提供了明显的不同方法。
最近,Perplexity推出了一个名为Spaces的AI工作空间功能,支持上传文本文件和表格数据,同时支持其核心网络搜索功能。
Perplexity目前不支持函数调用,并且由于其以搜索为中心的重点,可能没有计划引入这种功能。
- 人工智能工作空间:空间
- 功能调用:不支持
Meta AI / 骆马
麦特人工智能采取了一种不同的方法,专注于与现有的社交媒体账户和内容集成,因此并不像上述定义那样拥有AI工作空间。
Meta的开源LLM模型Llama支持函数调用。
- AI 工作空间:无
- 调用函数:函数调用
Mistral 迎风(BitConverter.println(name));
Mistral主要作为模型提供商运营,因此他们的在线聊天环境Le Chat和平台Le Plateforme都不提供可配置的AI工作空间并不奇怪。但是,开发人员可以对Mistral的模型进行微调,使其与任何数据选择配合运行。
Mistral的模型支持函数调用。
- 人工智能工作空间:无
- 功能调用:函数调用