OpenAI o1-预览:更智能推理的新时代

OpenAI 刚刚发布了一系列新的人工智能模型,旨在在给出答案之前更加谨慎地思考,以解决困难问题。这个系列中的第一个模型名为 OpenAI o1-preview,从 9 月 12 日开始提供。这些模型经过训练,旨在通过更加深思熟虑的方式帮助解决科学、编码和数学等领域的棘手问题。

什么让OpenAI o1与众不同?

与老版本的AI模型不同,OpenAI o1-preview经过训练可以更深入地思考问题。它不会急于给出答案,而是会花更多时间思考不同解决问题的方法,检查自己的工作,并纠正任何错误。这让它在处理需要多个步骤才能正确解决的困难任务时表现得非常出色。

在早期测试中,o1-preview模型完成了通常只有非常高级的学生,如博士生,在物理、化学和生物等学科中才能完成的任务。以下是一些示例:

  • 在国际数学奥林匹克竞赛(IMO)测试中,先前的人工智能模型(GPT-4)只解决了13%的数学问题。新的o1模型解决了83%的问题,显示它如何思考解决困难挑战。
  • 在编程比赛中,它在参与者中排名前89%,证明它很擅长解决技术任务。

您可以在OpenAI的研究中阅读有关模型表现如何的更多细节。

模型是如何工作的呢?

OpenAI o1-preview的重要特点是模拟人类思维方式。它不会急于给出答案,而是会花时间从不同角度分析问题。例如,如果它遇到一个困难的数学问题,它不会匆忙。它会考虑不同的解决方案,发现任何错误,并改进答案 - 就像一个人会解决棘手问题一样。

假设你要求它创建一个复杂的算法。o1-preview可能会尝试几种方法,检查错误,并最终提供一个深思熟虑的解决方案。

谁可以从OpenAI 01中受益?

o1-preview 模型可以帮助许多需要先进思维的领域的人们:

  • 保健研究人员可以使用它快速分析细胞数据。
  • 物理学家可以依赖它来编写诸如量子光学之类的复杂公式。
  • 开发人员可以使用它更准确地编写和测试代码,节省修复错误的时间。

提高安全性

OpenAI o1-preview的一个重要部分是其对安全性的关注。OpenAI已经训练它通过推理更好地遵守安全规则。这意味着它更不容易违反规则或被用于有害的方式。

例如,在用户尝试让AI违反其安全规则的测试中(称为“越狱”),旧版GPT-4模型得分为100中的22分。新的o1-preview模型得分为84,表明它在遵守规则方面要好得多。

OpenAI还与美国和英国的AI安全组织合作,确保模型在更多人使用之前经过彻底测试。

OpenAI o1-Mini:开发者的更便宜选择

对于需要聪明解决问题但不需要o1-preview全部功能的开发人员,OpenAI还推出了一个更小的模型,名为OpenAI o1-mini。 它具有相同的推理核心强项,但价格便宜80%且工作更快,非常适合需要仔细思考但不需要大量额外信息的任务。

例如,一名在财务软件上工作的开发者可以使用o1-mini来以更低成本找到并修复复杂的编码问题,同时仍然获得出色的结果。

如何访问 OpenAI GPT-3

从今天开始,ChatGPT Plus和Team用户可以在ChatGPT界面中尝试o1-preview和o1-mini。目前,o1-preview的每周消息限制为30条,o1-mini为50条,但OpenAI正在努力提高这些限制,甚至允许ChatGPT自动选择最适合任务的模型。

ChatGPT企业和教育用户将在下周获得对这些模型的访问权限。符合API第5层资格的开发人员可以现在开始测试这些模型,每分钟请求限制为20个(RPM)。虽然API目前还不支持诸如函数调用之类的功能,但OpenAI计划很快添加这些功能。

OpenAI也正在努力将o1-mini带给所有的免费ChatGPT用户,这样每个人都可以使用这些强大的工具。

摘要

OpenAI o1系列是人工智能在解决困难问题方面的一大进步,尤其在科学、数学和编码等领域。无论您是研究员、物理学家、开发人员,还是面对复杂任务的任何人,o1预览版都可以帮助您获得更好的结果。如果您需要更快速更经济的解决方案,o1-mini是一个很好的选择。

要开始使用这些模型,请查看API文档并探索它们如何使您的工作更容易和更高效。

享受了这篇文章吗?如果您觉得它有帮助,请给予赞赏,并别忘了关注KagglePro获取更多有见地的更新和提示!您的支持有助于保持社区充满活力,内容丰富。

从Kagglepro LLC阅读更多

2024-10-01 04:20:00 AI中文站翻译自原文