ChatGPT不再懒惰了!OpenAI最近的更新中有降价和新模型。

OpenAI最近宣布了关于新的嵌入模型、价格降低、GPT模型改进和修复、增强的审核模型以及更好的API管理工具的最新更新。让我们逐个详细了解这些内容。

Generated by DALL-E 3

新嵌入模型以更低价格提供

以简单的方式来说,在人工智能和机器学习的背景下,嵌入是将单词或短语转化为数字的一种方式。这个过程帮助计算机理解和处理文本。你可以想象一个图书馆,每本书都由一个独特的代码表示。这个代码不是随机的,它捕捉到了这本书的本质——它的流派、主题和风格。同样地,嵌入将文本转化为一个能捕捉其含义的代码,使得人工智能更容易处理。一个实际的应用场景是在搜索引擎中。当你搜索一个术语时,搜索引擎使用嵌入来查找和排列文本,不仅仅是根据使用的确切词汇,而是根据它们的内容与你的搜索查询的含义有多接近。

一个嵌入模型是一个已经训练过的机器学习模型,它可以将文本转化为一组数字列表。这个数字列表被称为向量,而数字的数量被称为维度。

之前的OpenAI嵌入模型被称为text-embedding-ada-002,生成的向量维度为1,536。而新模型text-embedding-3-small和text-embedding-3-large分别生成1,536维和3,072维的向量!

第一个新模型text-embedding-3-small旨在成为text-embedding-ada-002的继任者。它更高效(更快速和相关),而且价格更便宜,因为价格降低了5倍。第二个新模型text-embedding-3-large正如其名称所示,尺寸更大。它更强大,表现优于以前的模型,并且价格适宜。

Performance comparison between the two new embedding models and the previous — source: OpenAI blog

MIRACL和MTEB是用于测试嵌入模型的两个数据集。MTEB包括8个任务中的56个数据集,而MIRACL是一个跨越18种不同语言的多语种数据集,重点关注即席检索。在论文上看上去令人惊讶。我总是对这种百分比和所选择的数据集持怀疑态度。这就像汽车制造商宣布创纪录的续航里程,但只在非常特殊的条件下。我仍然需要亲自尝试并在我的数据上进行确认。

同时最重要的是关于新的嵌入模型,现在可以通过嵌入API的一个参数来选择维度的数量,这要归功于OpenAI训练模型的一种新方式。这基本上允许在性能和速度之间进行调整。正如您可以在下表中看到的,根据您的应用或使用情况,减少维度的数量可能是值得的!

Performance comparison when changing dimension — source: OpenAI blog

新GPT-3.5 Turbo版本,价格更低

随着这个新的GPT-3.5 turbo版本的推出,OpenAI引入了各种改进,包括更高的准确性和修复以前的错误。OpenAI已将该模型的输入和输出价格分别降低了50%和25%,使其更易于获取。这是一个好消息,可以在GPT周围创建更便宜的解决方案或POC。

更新的GPT-4 Turbo预览

GPT-4 Turbo也得到了新的更新,这是非常值得欢迎的。在最近的一篇文章中,我提到了ChatGPT变得懒散的事实,并给出了可能的假设。这个新发布的版本旨在更彻底地完成任务,解决了先前对模型在任务完成中的“懒散性”所提出的关注,这非常不错。

为了提醒您,GPT-4 Turbo是OpenAI最强大和先进的LLM模型。它提供了128k的窗口上下文,比GPT-4更低的价格,并拥有更新的知识截止日期。这款全新版本的GPT-4 Turbo将在即将到来的月份(2024年2月)上市。

增强的调节模型

新的免费文本审查-007模型是OpenAI迄今为止最强大的审查模型,使开发者能够更有效地识别潜在有害文本。

提高API使用理解和管理

最后,OpenAI推出了平台改进,以便更好地查看API使用情况并对API密钥进行增强的控制。这包括为API密钥分配权限和提供详细的使用情况指标追踪。这可能不是最令人兴奋的新功能,但仍是一项受欢迎的更新。了解成本来源并优化它们是始终有趣且重要的。

结论

在最近的更新中,OpenAI着重改进了其当前模型(GPT-3.5和GPT-4 turbo),但也发布了两个令人兴奋的新嵌入模型。

通过再次降价,OpenAI 在生成性人工智能工具市场上巩固了其高度竞争力和价格实惠的地位。此价格调整不仅提高了其可访问性,还巩固了其作为快速部署和市场效率的最佳解决方案的声誉。

感谢阅读。如果你喜欢这篇文章,或者想鼓励我写更多的话,请随意给我点个👏

2024-01-29 04:39:55 AI中文站翻译自原文