从“令牌”到“GPT魔药”

通过释放开源LLMs和GPU租赁，我与开源LLMs一起展开的计算探索之旅，揭开储蓄的奥秘。

ChatGPT中文站 — AI Generative Wizard holding neuron

你好，好奇的学习者！

想象一下，我们身处于一个充满魔力的世界，这个世界里有一种特殊的计算机程序被称为大型语言模型（LLMs）。这些LLMs就像巫师一样，能够理解并生成类似人类的文本。

现在，我想告诉你关于我最近承担的一个大项目。我必须给这些LLMs四百万个不同的任务，比如回答问题或者写句子。每个任务就像是一个有很多碎片的拼图，而且总共需要巨大的工作量，大约五十亿个碎片！

通常情况下，当我们使用这些LLM时，我们必须为它们工作的每个小部分付费，就像把硬币放入自动售货机一样。如果我为这个项目付费，将会花费很多钱！

但是这里有个有趣的部分：我找到了一个聪明的方法来节省很多钱。我不是为每一件东西付钱，而是根据LLMs工作的时间付费，就像租用一个魔法咒语一样，付一定时间的费用。事实证明，这样做要便宜得多。

因此，在这个故事中，我会告诉你我是如何做到的，什么有效，什么无效。

切记，这些东西的价格可能会变动，就像商店里的价格一样，可能会上涨或下降。但主要的想法是，当你有一个大项目时，使用这些特殊的LLM并像魔法咒语一样租借它们，可以节省很多钱。

聊天GPT API的编年史

在我的项目开始时，我使用了两个特殊的计算机程序，分别叫做GPT-3.5和GPT-4。这些程序在处理文字任务方面非常出色，比如回答问题或写句子。在这些任务中，GPT-4比GPT-3.5稍微好一些。

现在，这是重点：使用这些程序就像在商店购买东西一样需要花费很多钱。想象一下，如果我必须使用这些程序来处理四百万个不同的任务，那将会非常非常昂贵。保持HTML结构

但有一个问题：尽管GPT-4要比GPT-3.5更好，但价格却比GPT-3.5贵得多。然而，GPT-3.5有时会犯错误，大约有2到3%的时间。因此，我不得不决定是否值得花更多的钱来用GPT-4得到稍微更好的结果。最后，花7600美元在一个主要用于个人使用的项目上是没有意义的。

简单来说，就像在一个昂贵但稍微更好的工具和一个便宜但相当好用（即使存在一些错误）的工具之间做选择，而这就是有趣之处。

开源魔法书的救赎

所以，有一种神奇的做事方式叫做“开源魔法书”。它就像一本特殊的法术书，任何人都可以免费使用。有趣的是我们如何支付。与其为每个小事情付费，比如使用一个魔法词语，我们为使用魔法书的时间付费。

想象一下有一个叫做Petals.ml的地方，你可以免费使用这本魔法书，但是你需要遵守一些规则。

我尝试了一些来自“拥抱之脸”（Hugging Face）团队的不同魔法书籍，我发现有一本名为“稳定白鲸2”（Stable Beluga 2）的书已经相当不错了。它比另一本名为“GPT-3.5 Turbo”的书要好，但却不如“GPT-4”那本好。然而，“稳定白鲸2”需要一台非常强大的计算机才能良好运行。因此，我决定尝试更大版本的“稳定白鲸2”，但结果并不如我所希望的那样。

简单来说，就像使用免费的魔法书来完成你的工作，但是你必须小心规则。有些魔法书的效果比其他书更好，有时候更大的魔法书需要非常强大的电脑才能正常工作。

The Art of Enchantment: 细致调校

为了让我的魔法更加强大，我结合了两个特殊工具：GPT-4和Petals.ml（它就像一本巨大的叫做“稳定白鲸2-70B”的魔法图书馆）。我使用这些工具制作了自己的特殊魔法书，就像一个巫师的咒语书一样。

我用Petals.ml写下了25,000套问题和答案，还用GPT-4写了2,000套。因为Petals.ml就像一个图书馆，需要等一会儿才能得到神奇的书籍，所以速度有些慢。如果我做了全部四百万套问题和答案，那得花上一整年！

但好处是，Petals.ml让我免费使用它的魔法，我用它制作了27,000套问题和答案。通过我创建的这本特殊魔法书，我使得GPT-4变得更好。这只花费了6.6美元，并且只需要使用一台被称为Nvidia A100 GPU的强大计算机进行了六个小时。最终，我的魔法书比GPT-3.5效果更好，尽管它仍然略微落后于GPT-4。