训练您的数据的聊天 GPT
聊天 GPT 在过去几个月里席卷了互联网。阅读有关它的资料后,我首先想到的问题是如何在我的自定义数据上运行它?经过一些研究和调试,我发现了三种在您的数据上运行聊天 GPT 的方法。
- 提示工程
- 嵌入
- 优化
提示工程
什么是提示?
提示是LLM/Chat GPT的输入。例如,在下面的图像中,提示是:
“请向我推荐5本和《神鬼认证》系列类似的小说。只需写出书名和作者姓名。”
提示中的自定义数据
在提示框中注入您的数据或上下文是使用 Chat GPT 自定义数据的最简单方法。例如,在下面的图像中,提示框包含一家公司 2023 年第一季度和第二季度的销售数据。Chat GPT 的问题是返回销售额的百分比变化。
何时使用即时工程?
有许多不同的及时工程应用。事实上,及时工程被认为是未来备受追捧的专业技能。
考虑到使用自定义数据,它非常适合为LLM提供指令或对较小数据集执行搜索/问答。但是,当您想要使用一组文档/网页作为LLM的输入时,这不是最佳方法。
嵌入
什么是嵌入?
嵌入是一种将文本/图像/音频信息表示为数字形式的方法。想象一下,您希望基于相似性将苹果、香蕉和橙子分组,这可以使用“嵌入”来完成。
一个嵌入将每种水果转换为数字形式(向量)。例如,苹果 -> (0.3,0.8,0.7) 香蕉 -> (0.8,0.1,0.3) 橘子 -> (0.4,0.7,0.6)
看着这些嵌入,我们可以看到苹果和橙子有相似的数字。我们可以说它们更相似。
使用嵌入技术
我会在随后的帖子中分享生成文档嵌入并将这些嵌入传递给Chat GPT的代码。以下图表在概念上解释了如何使用这些嵌入来使用Chat GPT或任何其他LLM从您的文档中检索信息。
何时使用嵌入?
当使用情况是要摄入文档或网页并从这些文档中获取 LLM 响应时,嵌入式功能效果很好。当您希望聊天机器人从一系列策略文件中向用户提供响应时,它也可以很好地工作。
微调
什么是微调?
微调是一种教授模型如何处理你的输入查询以及应该是什么响应格式的方法。例如,您可以通过提供有关客户评论和相应情感的数据来微调模型。
提示:我真的很喜欢这个产品。我强烈推荐它。完成:正面 提示:我发现送货体验不太好。完成:负面
这里,“prompt”是输入的一个例子,“completion”是相应输出的一个例子。
现在,如果您提供另一篇评论作为 Chat GPT 的提示,它将为您提供相应的情感。
另一个例子是
提示:2023年第一季度,1000万美元,增长5%,良好,积极。 完成:2023年第一季度收入为1000万美元,比前一季度增长5%。街头上对该公司的情绪良好,业务前景积极。 提示:2023年第二季度,2000万美元,下降2%,中立,负面。 完成:2023年第二季度收入为2000万美元,比上一季度下降2%。街头上对该公司的情绪中立,业务前景负面。
您可以提供许多例子来微调模型,然后向模型提问。
有限的基本型号(达芬奇、居里、巴贝奇和艾达)提供微调功能。
何时使用微调?
微调通常用于想要为特定任务训练模型,然后希望模型在该范围内响应。任务可以是电子邮件分类、情感分析、实体提取、基于规格生成产品描述等。
我在这篇文章中仅仅涉及了这些技术的基础。每一种技术都有更多的细微差别。我正在和你一起学习,并将继续分享我在这个令人兴奋的领域的学习经验。请关注!