聊天GPT诞生与解释
去年11月,Facebook背后的公司发布了一个名为Galactica的聊天机器人。在大量的抱怨声中,人们指责该机器人编造历史事件并胡言乱语,于是Meta将其从互联网上移除。
两周后,旧金山初创公司 OpenAI 发布了一款名为 ChatGPT 的聊天机器人。它引起了全球的轰动。
两个机器人都由同样的基础技术驱动。但与Meta不同,OpenAI利用了一种正开始改变人工智能构建方式的技术,对其机器人进行了精炼。
在ChatGPT发布之前的几个月,公司雇佣了数百人使用一个早期版本,并提供精准的建议,以帮助完善机器人的技能。就像一支导师队伍指导一位小学生一样,他们向机器人展示如何回答特定问题,对其回答进行评级并纠正其错误。通过分析这些建议,ChatGPT学会了成为一个更好的聊天机器人。
传统技术“从人类反馈中强化学习”现在正推动着人工智能行业的发展。它对话机器人的转变程度超过其他任何进展,将其从奇特玩意儿变为主流技术。
这些聊天机器人基于能够通过分析数据来学习技能的新一代人工智能系统。大部分这些数据由美国和世界其他地区的庞大低薪劳动力团队进行策划、精炼和有时创造。
多年来,像Google和OpenAI这样的公司一直依赖这些工人来准备用于训练人工智能技术的数据。印度和非洲等地的工人帮助识别了训练无人驾驶汽车所使用的照片中的停车标志,以及构建医疗技术所使用的视频中结肠癌的迹象。
在构建聊天机器人时,公司依靠类似的工作者,尽管他们通常受教育程度更高。与过去通过机械式数据标记来培养人工智能发展的工作相比,人类反馈的强化学习要复杂得多。在这种情况下,工作者充当导师,努力给机器提供更深入、更具体的反馈,以改善其回答。
去年,OpenAI和其竞争对手Anthropic通过网站Upwork雇佣了美国的自由职业工作者。另一个著名实验室Hugging Face则通过数据整理创业公司Scale AI和Surge雇佣了美国工人。