什么是ChatGPT?
我知道ChatGPT周围有很多谈论。但是,除了它能回答一些详细问题外,谁都了解更多呢?在Avishkaar,我们的责任是将这项新技术拆分成易于理解的小部分,让我们的年轻创新者可以更好地理解并利用他们的创新思想来使用这项技术。
GPT 是“Generative Pretraining Transformer”的缩写。稍后我们会用技术术语更多地谈论它。
让我们通过将ChatGPT与现今的谷歌进行比较来解释它:
Google是一款强大的搜索引擎,它可以根据你输入的搜索请求在互联网上查找并展示信息。只需选择关键词即可,因此你的搜索请求不必是一个语法正确的问题。
Google搜索分为3个阶段:
- Web爬行 -这是发现Web上可用内容的第一步。大量的计算机程序寻找数十亿个URL来爬取互联网上的数十亿个页面。这些计算机程序称为GoogleBots。爬行之后,这些页面被扫描以查找更多链接和其他URL的信息,或者一些页面不再可用。这样,爬行不是基于任何固定数据集,而是继续变化。
- 索引化 - 在这个阶段,Google试图了解不同页面的内容。这包括对文本、图像、视频等进行处理和分析,并创建不同属性的索引。
- 服务 - 当您输入询问时,谷歌根据查询从创建的索引中搜索内容,并向您提供包含您所要求的信息的页面。
ChatGPT另一方面为您的详细查询解释并生成类似于人类的文本。在这种情况下,查询通常是一句正式的句子,用于一般讨论。这使它能够进行有意义和丰富的对话。
现在让我们来学习一下生成式预训练转换器是什么:
- 生成式——按照词典意义,它能够生成新事物,这种情况下是文字。这就是为什么你看到它会写电子邮件、文章或对你的学校作业问题进行描述性回答。
- 预训练 - 再次按照字典意义,它学习了大量的数据并进行了训练。ChatGPT的预先训练的数据包括大量的书籍、文章等。
- 变压器 - 这基本上是一个机器学习模型,它理解语言的结构以及每个单词之间的关系。这些模型也被称为LLM(大型语言模型)。该模型中的每个单词被令牌化,并创建与其他单词(或令牌)的关系,以构建非常大的数据集,以理解并输出完整的类人响应。通过知道GPT-3大约训练了5000亿个令牌,您可以想象数据集的大小。
我希望这有助于你理解这个技术的运作方式。目前有一场关于这种技术好坏的辩论正在进行中。当某些非常颠覆性的东西悬挂在我们正常生活之上时,这场辩论总是会发生。我们必须记住,是人类的思维创造了这种技术,我们的思维将继续变得更强大。作为年轻的创新者,你们应该利用它来回答问题,但也要思考并给出你自己的个人观点来完成任务。我相信,像往常一样,这种技术变革将使我们的生活变得更好。
图片来源:Freepik