什么是OpenAI o1(ChatGPT o1)?
简介
这份笔记将总结OpenAI于2024年9月12日宣布的“o1”。它似乎被称为“OpenAI o1”,而不是“GPT-o1”或类似的任何名称。
什么是OpenAI o1?
OpenAI o1 是OpenAI开发的一系列新的AI模型。这个模型通过使其能够“在回答之前思考和进行推理”来提高响应的准确性。目前,o1-preview和o1-mini已经可以使用。未来,o1(以及可能会有一个名为o1-ioi的东西,根据OpenAI的文档)也可能会推出。
请访问:https://openai.com/index/learning-to-reason-with-llms/
当你向O1系列提问时,它会先考虑如何得出答案,然后再给出回应。(标题显示答案是如何形成的思维过程。)
在数学、编码和科学领域表现优秀,胜过现有模型
它在数学、编码和博士级科学方面的得分显著高于GPT-4。
在GPQA Diamond上取得了高分,这是一个具有挑战性的智力基准测试,涵盖化学、物理和生物。 (此表现超过了人类专家).
GPT-4 仍然被优先选择的情况
有结果表明GPT-4的回应可能在写作等任务中仍然被优先选择,这意味着o1并不一定是无可匹敌的。可以说在加强推理过程至关重要的情况下,o1更有益。
减少幻觉和其他问题
与GPT-4相比,根据结果显示,o1显示出幻觉减少且不太容易越狱(输出不适当内容)。
请查看以下链接以了解更多信息:https://openai.com/index/openai-o1-system-card/
使用API
该模型也可以通过API使用,方法是将模型名称设为“o1-preview”。在使用时,不再需要在post请求中包括max-tokens和temperature等参数,因此必须省略它们以确保功能正常。
请访问https://platform.openai.com/docs/guides/reasoning/quickstart。
使用API的示例代码(GAS)
作为使用Google应用脚本(GAS)API的一个示例,可以使用以下代码:
function OpenAIo1(prompt) {
var model = "o1-preview";
var apiUrl = "https://api.openai.com/v1/chat/completions";
const apiKey = getApikey()
let messages = [{role: "user", content: prompt}];
const payload = {
model: model,
messages: messages,
};
const options = {
method: "POST",
contentType: "application/json",
headers: {
"Authorization": "Bearer "+apiKey
},
payload: JSON.stringify(payload),
}
const response = UrlFetchApp.fetch(apiUrl, options);
var responseText = response.getContentText();
var json = JSON.parse(responseText);
return json.choices[0].message.content.trim();
}
在医学领域提高鉴别诊断的准确性
这个观察是基于向 o1-preview 询问公开可获取的案例研究。
GPT-4还提供相当智能的答案,但o1-preview产生的结果确实令人印象深刻,特别是考虑到它的思维过程。(当然,本身的估计是正确的。)
- 当对诊断感到不确定时该如何思考
- 什么样的不同诊断可以被提出?
我相信这两点使得它非常有用。它不仅可以在临床实践中面对挑战时使用,而且在教育目的上也看起来很有前途,其思考过程可以作为一个参考。
其他信息
有关用户数量和使用频率的限制,但这些限制似乎正在逐渐放宽。最初,最频繁使用的用户,称为Tier 5,每周限制约为30次。截至2024年10月6日,Tier 4已扩展,使用限制增加到每周约10,000次。
请注意:https://help.openai.com/zh/articles/9824962-openai-o1-preview-and-o1-mini-usage-limits-on-chatgpt-and-the-api