结构化输出和思维链：增强GPT-4o完成

Foto di Bernice Chan: https://www.pexels.com/it-it/foto/matematica-figure-figurine-apprendimento-3649874/

介绍

在人工智能不断发展的领域中，以迅速进行工程处理已经成为发挥大语言模型潜力的关键技能。在各种技术中，有一种因其高效性和简单性而脱颖而出：指导模型在生成回应之前“思考”。这种方法被称为Chain of Thought (CoT)，通过GPT-4o的结构化输出功能的引入，使其达到了新的高度。让我们探讨这种创新是如何改变AI交互游戏的。

逐步思考的力量

如果您花时间尝试使用像ChatGPT、Claude或Llama这样的人工智能模型，您可能会遇到提示，比如“逐步思考”，“解释您的推理”或“在回答之前反思”。这些提示旨在引导人工智能进行逻辑思维过程，就像我们处理复杂问题的方式一样。

这种技术不仅仅是一个技巧；它是改进人工智能性能的基本方法。通过鼓励模型将推理分解成步骤，我们让它可以：

1. 有效地组织其广泛的知识 2. 确定并纠正其逻辑中的潜在错误 3. 提供更透明和可追踪的输出

GPT-4o：把思维链推向更高水平

OpenAI 最新的语言模型，代号为“草莓”(o1-preview)，经过特别训练，可以将这种逐步方法应用到遇到的每个任务上。这意味着模型本身处理问题时会采用更有结构和深思熟虑的方法，即使没有明确的指令。

结构化输出：一个新的API功能

GPT-4o中最令人振奋的发展之一是在API级别引入了Structured Output。这一功能允许开发人员轻松实现一系列思维推理，方法是创建一个验证模式，促使模型填充其思维过程。

这是如何运作的：

开发人员定义他们期望输出的结构。
模型使用其推理步骤填充此结构。
最终输出是基于这个结构化思维过程生成的。

就像在OpenAI文档页面上找到的下面例子一样。

from pydantic import BaseModel
from openai import OpenAI

client = OpenAI()

class Step(BaseModel):
    explanation: str
    output: str

class MathReasoning(BaseModel):
    steps: list[Step]
    final_answer: str

completion = client.beta.chat.completions.parse(
    model="gpt-4o-2024-08-06",
    messages=[
        {"role": "system", "content": "You are a helpful math tutor. Guide the user through the solution step by step."},
        {"role": "user", "content": "how can I solve 8x + 7 = -23"}
    ],
    response_format=MathReasoning,
)

math_reasoning = completion.choices[0].message.parsed