生成式人工智能 - 简介
在过去的几个月中,像chatGPT、Dall-E、BARD等工具以惊人的速度占领了科技世界。这种热潮是有道理的,因为这些模型完成了一些令人惊叹的任务,如生成文章、编写代码、创建模因等等。我们还看到它们正在危及某些行业 :(
所有这些时髦的模型都属于生成型人工智能的范畴,并且在未来几年将会扰乱许多垂直领域。高德纳认为,GenAI是推动产品革命的最具影响力技术之一。这些进步促使我开始撰写有关生成型人工智能的博客系列。在这第一个小型博客中,我想谈论一下GenAI的基本细节,并在接下来的博客中讨论其各种类型、开源模型以及实现一些实际应用。让我们开始吧!
生成式人工智能是什么?
生成式人工智能是一种人工智能技术,可以生产多种类型的内容,包括文本、图像、音频和合成数据。主要思想是生成完全原创的艺术品,看起来就像真的东西一样。
为了提供GenAI的相关背景,请参考以下图片 -
深度学习或机器学习模型可以分为两种类型——判别式和生成式。
判别模型通常在输入的标记数据上进行训练,并尝试识别特征和标签之间的关系。一个经典的有监督和无监督判别学习模型如下图所示-
例如,在对狗和猫的图像进行分类时,判别模型会尝试学习给定输入(图像)时标签(猫或狗)发生的概率。即使您提供自行车的图像,此模型也可以将其分类为猫,并赋予一定的概率。这意味着判别模型在不尝试理解猫和狗是什么的情况下,将有关猫和狗之间差异的信息压缩了起来。
这里是生成式人工智能建模。GenAI模型捕捉了输入和标签的联合概率分布。它学习了个别类别和特征的分布,而不是边界。这意味着当GenAI模型接收到一张狗的图像时,它可以预测这是一只狗的条件概率,并且也可以生成一张狗的图像。这种模型的概览如下图所示-
- GenAI 模型可以根据学习现有内容的方式创建新内容。
- 一旦从不同的数据中学习的过程完成,就会导致创建模型。
- 当给定提示时,上述训练有素的GenAI模型可以预测可能的回应 - 这会生成新的内容。
基于数据类型,GenAI模型在其功能方面有所不同。生成式语言模型以文本作为输入,可以生成新的文本、音频、图像和决策输出。生成式图像模型可以以图像作为输入,并执行像字幕、图像搜索、分辨率更改、生成视频动画等任务。
这些生成模型需要指令来进行操作。指令的清晰度和输入的质量决定了模型生成的输出质量。一旦提供这样的指令,GenAI模型就会给出完整的输出,而不是半成品的答案,这可以为我们节省很多时间。总之,生成算法旨在进行整体过程建模,而不会丢弃任何信息。我们将在未来的博客文章中讨论更多相关内容。
现在,我们就要结束这篇微型博客了。在下一篇博客中,我们将讨论生成式语言模型、提示设计、现有的开源模型、微调以及使用代码实现的实际案例。在那之前,干杯!!