什么是AI代理?

生成式人工智能中的AI代理基础

Photo by robin mikalsen on Unsplash

现在,当谈到与GenAI相关的任何事情时,你经常会听到术语“代理”。在这篇文章中,我们将尝试理解代理是什么,以及这个概念如何改变你使用生成AI的方式。

什么是代理商?

在生成式人工智能中,代理者就像是一个虚拟助手或数字实体,旨在执行特定任务、做出决策或解决问题。通常使用LLM + 一些第三方API、数据库,甚至特殊功能的组合来完成任务。它还可以具有任务执行和决策能力。

代理人与LLM有什么不同?

让我们通过一个例子来理解这个。

使用电子邮件代理和LLM生成电子邮件

  1. 使用LLM

您给一个LLM一个提示“写一封电子邮件…”,它会给您一个输出。

Subject: Thank You for the Meeting

Dear [Client Name],

I wanted to take a moment to thank you for the time you took to meet with us today. It was a pleasure discussing [specifics of the meeting], and we're excited about the opportunity to work together.

As promised, please find attached the proposal for your review. If you have any questions or need further clarification, don’t hesitate to reach out.

Looking forward to hearing from you.

Best regards,
[Your Name]

现在,正如你所注意到的,它只是生成文本。还有很多工作等着你去完成。

复制电子邮件文本。

打开你的电子邮件客户端。

填写收件人的详细信息。

附上提案手动。

点击发送。

2. 使用电子邮件代理

电子邮件代理程序不仅会输出文本,而且会执行剩余的步骤(如果已启用)以完成任务。

因此,

一个代理是一个具有访问其他名为工具的功能的LLM。

一个代理人的关键方面是它们如何处理任务执行。当一个代理人收到指令时,它不仅仅是生成内容 - 它通过与连接的工具互动来执行任务。例如,为安排而构建的AI代理人不仅仅是建议会议时间;它会连接到您的日历API,找到可用的时间段,并预订会议。真正的力量在于代理人能够弥合产生想法或内容与将它们转化为行动的差距,而无需人类干预。

代理如何执行任务?

作为内部使用LLMs的代理人,API /数据库或任何其他工具之间的交互是如何发生的?使用定制代码

例如,如果是一个使用天气API作为工具的天气代理,可以按照以下步骤与API交互,并获取特定城市的结果。

用户:新德里的天气如何?

代理人:

在代理的LLM中首先分析是否需要工具。例如:它可能有一个系统提示:“检查用户提示中是否要求某个地方的天气”。

如果需要工具,在这种情况下,从提示(新德里)提取实体。

一个请求发送到天气API(工具),带有实体作为参数。

结果被LLM视为上下文,并最终得出答案。

所有这些步骤将使用一些自定义代码来完成!

以上是任务执行的一种方式。还存在许多其他方法,通过这些方式执行/交互也可以发生。

一个AI代理的例子

一些我能想到的常见代理人

  1. 天气代理:LLM + 天气API
  2. 迷惑:LLM + 网络访问
  3. 客户支持:LLM + 数据库访问
  4. 西班牙代理: LLM + 一个内部传递的特殊提示,只能用西班牙语回答

人工智能代理的显著特点

  1. 自主权:代理人可以自己做决定并采取行动,无需持续的人类干预。例如,他们可以搜索数据库或进行计算。
  2. 面向任务:AI代理通常被构建来解决特定任务或问题,例如GitHub-Copilot,ChatGPT中的自定义GPT等。
  3. 他们通常使用称为工具的外部功能。 这些工具可以是某种API、数据库等。
  4. 他们也可以执行任务(就像我们在电子邮件代理示例中讨论的那样)。

AI代理的重要性

代理人将LLMs 的实用性扩展了1000倍,并将LLMs 转变为助手,而不仅仅是文本生成机器。

  • 任务自动化:代理人自动化复杂的、多步骤的工作流程,超越了内容生成。
  • 系统集成:它们将人工智能与外部工具(例如API、日历)连接起来,以执行真实世界的行动。
  • 决策:代理可以独立选择并执行任务,无需不断的用户输入。
  • 实时行动:代理商与实时数据进行交互,做出动态决策并实时更新。
  • 个性化:代理记住用户偏好,并根据过去的互动进行调整。
  • Reduced Human Intervention: 代理人处理从头到尾的任务,尽量减少手动工作。
  • 可扩展性:代理可以高效处理重复、大规模的任务,释放出人力资源。

结束之前,

什么是多人工智能代理编排?

多智能体编排(MAO)是指具有不同能力的多个AI代理一起工作以解决问题。

一些需要考虑的关键特点:

AI代理进行逐步讨论以达成最终解决方案。

AI代理以对话的方式进行交流,类似于人类互动。

代理的切换由LLM自动管理。

用户可以在团队中为AI代理分配不同的角色。

这很令人兴奋,可以帮助解决几个复杂的使用情况。

想象一种情景,您需要计划一次商务旅行。通过多智能体编排,不同的AI代理可以共同合作完成任务。

  • 一个代理可以通过检查各种航空公司的API来处理航班预订。
  • 另一位可以管理酒店预订。
  • 当第三方代理在目的地安排会议与您的联系人时,这些代理会相互沟通并共享信息,如日期或偏好,以确保一切同步。

这种无缝的互动方式模仿了一组人类助手共同处理复杂任务的方式,使得基于人工智能的工作流程变得高效。

潜在挑战

虽然人工智能代理提供了令人难以置信的潜力,但它们的实施也面临一些挑战。

  • 首先,代理系统在很大程度上依赖于外部工具的可靠性,例如API或数据库,这意味着这些工具的任何停机或错误都可能导致代理失败。
  • 其次,代理人经常需要仔细设计,以确保他们的决策能力与用户的预期保持一致,特别是在像金融交易或敏感数据处理等关键任务中。
  • 构建多智能体系统可能会很棘手。
  • 最后,当代理访问多个系统时,保持安全和隐私是另一个重要考虑因素。

希望你尝试创建代理!

2024-10-30 04:12:16 AI中文站翻译自原文