超越错误信息——在无限内容的人工智能世界中航行

ChatGPT中文站
https://lexica.art

“图书馆将永存;它是宇宙。至于我们,一切都没有被写下来;我们不会变成幽灵。我们走过长廊,搜索书架并重新排列它们,寻找在混乱和不连贯的里程中意义的线条,阅读过去和未来的历史,收集我们的思想和收集他人的思想,有时瞥见镜子,在其中我们看到了信息的生物。” — 何塞·路易斯·博尔赫斯,《巴别图书馆》

错误信息来自生成式人工智能确实是一个重要的问题,但实际上它只是更大问题的一个子集。我们面临的更大问题是有限数量的意识如何消费无限数量的内容的挑战。创造超出人类意识消化信息速度的信息意味着什么?

豪尔赫·路易斯·博尔赫斯的《巴别塔图书馆》是一篇短篇小说,介绍了一个由无数相互连接的六边形房间构成的宇宙,每个房间里充满了从包含每个想象得出来的25个符号组成的所有可能的书,这个虚构的图书馆代表了一个无限的、令人不知所措的、且在很大程度上难以解读的信息宇宙。就像博尔赫斯的图书馆一样,AI系统的输出提供了几乎无限量的信息,这带来了规模和理解上的挑战。在这两种情况下,存在着几乎无限量的数据,其中大部分可能永远不会被人类意识所消费或认可。导航并理解这个海洋中的信息的任务——区分真假,甚至从平凡中找到有趣的——回响着我们面临的挑战:如何应对AI生成内容的蓬勃发展。《巴别塔图书馆》和我们当今现实的惊人相似之处,强调了我们现代任务的重要性:建立一个不会淹没我们的无用或错误信息的系统。

为了说明这一点,让我们想象一个情景,即大语言模型(LLM)或人工智能生成的所有信息都是准确的。即使在这种情况下,我们仍然面临着一个重大问题,因为我们的系统并没有设计用来处理由人工智能模型产生的海量信息或连贯文本。作为一个文化,我们缺乏应对这种转变的能力。以前,虽然没有人能够与所有信息进行交互,但每一条信息都曾经被人类处理过。这确保了产生信息和知识的基本开销。

我们未来几年的最大挑战是确保我们创造出一个可知晓的系统,一个不会淹没我们于无用或错误信息的系统。错误的信息和错误信息一样危险,即使它是真的。即使你的所有餐点都健康,每天吃九顿也会带来不良影响。我们面临着一个规模挑战,其中错误信息只是其中的一个子集。我们需要考虑我们所生产的信息的目的、它最终的位置以及如何创造强大的工具来探索大量的自然语言数据。

事实上,我们拥有与知识进行更大规模互动的接口。借助语义搜索和摘要等机制,个人能够接触到比以前更大的信息体。挑战在于设计这些面向知识、经验和互动的接口,使其适合个人或组织的水平,并与信息的生产保持同步。

挑战的一部分涉及将真实与虚假区分开来,或者如果我们谈论概念发展或虚构写作,将有趣的与平庸的、解释性的与非解释性的区分开来;本质上,分辨好坏。然而,这只是问题的一部分。即使你已经精选出了数据集,你仍然面临它的规模、分析以及如何与之交互、如何体验它和如何了解它的问题。

在2021年初,我创作了一件艺术作品,名为“二万份爱之诗和一首绝望之歌”。我使用《GPT-J》和《GPT-Neo-X》的方式生成了20,000首样式符合巴勃罗·聂鲁达之风格的爱之诗,并将它们印刷出来,在奥克兰市中心的一家画廊里读了10个小时。这个项目的一个有趣方面是,这些诗歌中的大部分,可以估计大约95%,永远不会被人类阅读。它们永远不会被一个有意识的人体验到。这就像是对未来几年中生成式AI内容开始蔓延的发展趋势的一个隐喻。

水印可以成为解决方案的一部分。 进行文本或图像水印的原因远远超出了版权范畴。 我们将用于浏览这个巨大扩展的知识库的大多数工具都将是必要的自动化。 因此,我们必须创建自动化方法来检测文档的来源,包括确定它们是否为人工智能生成的。 这对于版权或错误信息等问题可能至关重要,但它在实用级别上还提供了至关重要的用例,使我们能够更有效地理解我们正在创建的世界。 当自愿地提供这些标记变得容易时,我们应该做到这一点,即使不适用监管要求也应该这样做。

最终,我认为这个问题没有监管解决方案,也没有技术解决方案。当创建额外信息的成本和价值降为零时,会剩下什么?简单的回答是其他文化元素的价值会增加:

  1. 应用和执行:如果创建和操作信息很容易,这并不一定意味着使用它更容易。
  2. 自动化知识创造过程:自动化地从信息中创造知识的方法有助于精炼信息,但这比说起来容易做起来难。理解我们如何进行知识创造并将其分解为其组成部分的工作是困难的,通常需要深入思考。研究组织Ought正在探索这一点,他们的Elicit平台是类似于这样一种非常有趣的早期尝试。
  3. 培养注意力和意图:可用的分心因素数量会激增,个人有意识地专注和忽略会成为至关重要的生存策略。
  4. 投资于与其他人建立信任关系:集体合作至关重要。与那些你知道他们利益与你一致的人合作是关键,在一个充斥着超现实机器人的世界里,拥有深度上下文的1:1关系是唯一可靠的种类。

我说这些是容易的答案,因为需要考虑的难点太基础,不能做出预测或者真正制定策略。我们在表达自己、学习和交流方面发生了根本不同的变化,这与我们以前遇到的任何事情都不一样。它将变得比现在已经变得更加奇怪和难以理解。我认为,为了确保我们以一种更美好的方式导航和建立这个新未来,需要做出大量的努力、有同情心,而且需要更多的运气。除此之外...也许我会在无限的书架上找到答案。

— 文章作者Jeremy Kirshbaum。欢迎随时通过jeremy@handshake.fyi联系。

想要与其他人才一起驾驭人工智能未来吗?请加入我们的生成 AI 大师班:https://maven.com/handshake/tech-bootcamp。

2023-10-20 17:05:18 AI中文站翻译自原文