AI: OpenAI 的人工智能“智能层”的另一条路线图。 RTZ#511
它们的“Swarm APIs”为“混合”多智能体人工智能层铺平道路,将人工智能应用程序和服务绑定在操作系统之间。
OpenAI长期以来一直描述其构建通向AGI(人工通用智能)和“超级智能”的抱负。我已经讨论了OpenAI通向AGI的路线图,通过AI级别如“推理”、“代理”等。
而且将有大量的AI产品和服务推出,当然包括本冬季推出的GPT-5‘Orion’。更不用说它更深入的‘思考’和‘推理’‘草莓’Open-01很快会从‘预览’转向全面推出。
但是这些产品和服务近期的流动,主要通过“APIs”(应用程序接口)传递给全球开发人员和合作伙伴,突显了OpenAI与其合作伙伴微软正在追求的另一条路线。
它是运行在AI技术堆栈操作系统之上的“智能”层。特别是,它是一个“多代理编排”层,管理在正确的时间和地点提供的机器“智能”。
他们提供了将概率‘LLM AI技术’与过去半个世纪使用的确定性软件系统相结合的能力。这些就是我之前讨论过的‘混合AI’系统,将会使人工智能在未来变得更加可靠、安全和弹性。尤其是Meta AI的首席Yann LeCun专注于这种混合方法,正如我几天前讨论过的那样。
这项额外的人工智能路线图的一个指示是本周对OpenAI的‘Swarm API’的更新。这有点技术性,但值得理解。Venturebeat在“OpenAI的Swarm AI代理框架:日常事务和交接”中做了很好的总结。
OpenAI开发者推出了全新的Swarm框架,这是一个旨在协调AI代理网络的实验工具,在科技社区中引起了轰动。与其他多代理框架不同,Swarm旨在提供一种简单、灵活和可控制的混合模式,使其脱颖而出。尽管仍处于早期阶段,Swarm对代理协作提供了新的视角,其中核心概念如“例程”和“交接”指导代理通过协作任务。
虽然 Swarm 不是官方的 OpenAI 产品,也不打算作为一个可以立即投入生产的工具,但它为企业自动化中多智能体系统的潜力提供了宝贵的见解。它的重点是简化智能体之间的互动,这是通过 Chat Completions API 实现的。这种无状态设计意味着智能体在互动之间不会保留记忆,这有助于 Swarm 的简单性,但限制了它在需要上下文记忆的复杂决策任务中的使用。
企业关注 AI 代理应用的热点是合适的,因为像微软、Salesforce等领先的软件公司都对此表现出强烈兴趣。
我之前已经讨论过人工智能中内存解决方案的重要性,Anthropic最近的内存缓存系统就是一个最新的例子。Venturebeat继续说:
开发人员需要实现自己的内存解决方案,这既提供了挑战也为定制提供了机会。这种简单和控制的平衡是吸引开发人员学习或构建多代理编排系统的主要亮点。
Swarm 在其轻量设计上独具特色,专注于易理解和实现。 这种方法使开发人员在执行步骤和工具调用方面拥有更精细的控制,更容易实验代理相互作用和编排。与 LangChain 或 CrewAI 等其他框架相比,Swarm 的无状态模型更容易理解,这使得对于那些对多代理系统新手来说更容易接近。
这些软件工具和层位于上图中AI技术堆栈图表的第5个方框中。
当然,Swarm的开源性也是值得注意的,再次突显了开放和封闭的人工智能软件系统对构建下一代人工智能“智能”系统至关重要。
决定开源Swarm为社区驱动的发展创造了机会,可能导致新的用途和改进。随着开发人员对Swarm进行实验,他们有助于不断增加对多智能体协作如何可以被利用来解决实际问题的理解,特别是在企业环境中,自动化可以提高效率,并让人类工作者专注于更具战略性的倡议。
其他LLM人工智能公司也专注于构建自己的AI“智能”层,为多代理AI编排系统提供混合功能。特别是当我们朝着人类被规模化的AI代理增强时。
但在 AI 技术浪潮的早期阶段,看到 OpenAI 如何引领潮流还是很有用的。敬请关注。
请注意:这里的讨论仅供参考,不构成任何投资建议。感谢您在这里加入我们。
你也可以免费订阅我的新闻简报“AI: A Reset to Zero”,在Substack上获取更多类似内容。