SynthID-文本: 用于AI生成文本检测的可扩展数字水印技术
Google DeepMind已经开发出SynthID-Text,这是一个用于给人工智能语言模型生成的文本添加水印的系统(例如ChatGPT或Gemini)。这项技术可以帮助识别一段文本是由人工智能还是人类创作的。
该系统通过微妙地修改AI在文本生成过程中选择单词的方式来运作,引入了一种作为数字水印的看不见的统计模式。创新之处在于在不影响生成文本质量的情况下实施这种方法,经过分析来自双子座的2000万真实用户回应后得到证实。
从技术上讲,它使用一种名为“锦标赛抽样”的算法,在文本生成的每个步骤中组织可能的候选词之间进行锦标赛,根据特定的统计标准选择获胜者。
含义重大:它能够可靠地区分人工智能生成的内容,这对于打击错误信息和滥用这些技术至关重要。该系统已经在Gemini和Gemini Advanced中实施。
其局限性包括只有当人工智能供应商自愿实施时才能发挥作用,如果文本被大幅修改或改写,水印可能会丢失。
这一发展代表者更加负责任和透明使用生成式人工智能的重要一步。
Dathathri, S., See, A., Ghaisas, S.等人。用于识别大型语言模型输出的可扩展水印技术。 自然634,818-823(2024年)。https://doi.org/10.1038/s41586-024-08025-4