使用ChatGPT进行翻译。

为什么应该(目前)持保留态度对待由人工智能生成的翻译?

ChatGPT中文站

(ChatGPT,生成式人工智能和大型语言模型(LLMs)周围的炒作(有理由的)似乎仍在继续。在我们小小的Mollie翻译队中,我们可以看到炒作体现为关于在(软件)翻译中使用GPT的问题激增,以及越来越多的请求审核GPT的输出。)

但是让我们停下来问问自己:翻译本身对AI和LLM翻译的最新和快速发展实际上有什么看法呢?ChatGPT是否真的增加了他们的生产力,还是增加了施加在他们身上的压力?

翻译行业分析

整个翻译行业的共识是,人工智能无疑会像神经机器翻译(NMT)引擎在10-15年前那样,大力改变行业。一些专家(不幸的是,其中许多人从未从事翻译工作)甚至宣称人类翻译的终结。然而,我们译者已被宣布为濒临绝种已有60多年了。然而,据RWS的翻译技术洞察2023和美国劳工统计局预测,翻译行业面临着越来越大的新雇员需求。但是,为什么我们的职业拒绝死亡呢?尽管我们人类有那些麻烦的劣势,比如“能力有限”、“薪水”、“周末”和“延迟交货”——这些是AI和机器翻译所不具备的。因为我们提供了一些,即使是ChatGPT都在努力实现的东西:

更好的品质和更多的语境意识

是的,像DeepL这样的“传统”神经机器翻译引擎以及本文介绍的ChatGPT提供的输出质量不断得到提高。尤其是后者正在迅速赶上。当然,这些进展必然会引发一堆戏剧性的头条,比如“ChatGPT击败NMT引擎”,“人工智能正在接近取代人类翻译”等等。但正如Lionbridge的这项研究所示,这些头条只是真相的一半。是的,GPT确实打败了神经机器翻译引擎,但:

  • 它是 GPT-4,而不是 ChatGPT。
  • GPT-4只比测试的最差的NMT:Yandex表现更好。
  • 唯一GPT-4胜出的语言组合是英译中(在这一语言组合中,Yandex通常表现最差,与其他语言组合相比)。

此外,该研究继续强调了GPT在翻译中的其他主要缺陷:变异性(或缺乏一致性)、API不稳定性和语言错误。虽然API的不稳定性很可能是由于GPT开发的早期阶段和API调用的突然激增引起的,很快就会得到修复,但变异性和语言错误应该为任何使用GPT进行翻译的人敲响警钟。

GPT(或任何生成式人工智能)通常被设计用来创建新的内容,无论是复制还是图片。因此,它已经内置了一个创造性的方面。但是,一旦您需要一致地使用特定术语,这在99%的翻译中是必要的,从营销材料到UI,技术文档和支持材料都是如此,这种创造性方面很快就会变得消极。然而,通过使用包含所有目标术语的特定、广泛的提示,仍然可以克服这种变异问题,以完成特定的翻译任务。

修复语言错误则需要AI开发人员的大量工作。这些错误范围从幻觉(发明单词、添加或删除句子的部分等)到更微妙的错误,例如错误的形容词/名词结尾和不正确的语境参考。

正如Lionbridge和德国口译和翻译协会(Bundesverband der Dolmetscher und Übersetzer,BDÜ)在最近的新闻发布中所述(由Slator提供的英文摘要在此处),这些语言问题的部分原因是由于AI将所有句子/文本部分视为独立的,因此无法理解跨句子引用。不幸的是,这种错误可能会严重损害公司的声誉,削弱客户信任,并在一些行业中甚至导致人员和财产受到严重损害。

当然,通过引入人为介入的工作流程可以消除或至少减少语言错误。然而,BDÜ估计,与经验丰富的后编辑专家相比,GPT输出的相对流动性和可读性将使基于人工智能生成的翻译后编辑更加困难。翻译人员需要更加注意每一个单词和字母,以捕捉在看似流畅的翻译中隐藏的所有错误,而客户和内部请求者关于成本、周转时间和可管理的数量的压力也将进一步增加。

这对你公司的翻译意味着什么?

基于对GPT表现相对于传统NMT的评估以及GPT当前翻译错误数量和严重程度的分析,我认为应该对AI生成的面向客户的翻译内容持怀疑态度。

特别是在产品或软件相关的翻译中,可变性可能会导致主要质量下降并迅速扩展到业务的其他部分。例如,想象一下,当相同的用户界面元素的翻译开始在您的软件/产品本身内部以及在支持和技术文件中的产品和逐步说明之间变化很大时,您的支持团队的工作量会增加。

这种不一致性的影响可能是巨大的:

  • 翻译记忆库受到低质量翻译单元的污染。
  • 所有使用ChatGPT翻译的内容的可用性大大降低。
  • 所有与使用ChatGPT翻译的内容有关的其他内容的可用性大大降低。
  • 客户满意度和信任的侵蚀
  • 寻找和重新翻译所有受影响的内容会增加额外的成本(而且这些成本比你想象的要快地达到6位数字!)

有哪些替代方案?

现在所有这些新闻和估计数据可能会让我们的某些读者感到沮丧。但别担心,因为仍然有一些替代方案可以利用(甚至已经积极使用):

  1. 鉴于以上 NMT 和 LLM 比较,很明显 Google 翻译、DeepL 及其类似产品暂时是没有专门的内部或外部翻译资源团队的更好选择。
  2. 如果您拥有专门的翻译人员或外部翻译服务提供商,请咨询他们关于在业务的各个领域建立健康的人工和机器翻译混合的可能性,并始终要求他们检查NMT和LLM生成的翻译。

一个展望未来的眼光

以上所有内容可能让人觉得我完全反对人工智能翻译,不管任何情况。而我确实有这样的想法。目前就是这样。

然而,我确信,LLM的快速进展实际上将使它们在不久的将来成为良好(甚至更好)的传统NMT的替代选择。但是,AI是否完全取代人类翻译员呢?这是一个棘手的问题,但可能并非完全如此。

在我看来更现实的是,人工智能和法律语言模型很快将成为所有翻译软件的重要组成部分,就像神经机器翻译逐渐成为普遍存在一样。因此,在计算机辅助翻译工具或翻译管理系统中的文件预翻译过程中,可能的未来场景是:

  1. 经典预翻译与翻译记忆之间的对比,充分利用一切可以利用的资源。
  2. 通过(定制训练的)NMT进行原始翻译,它们具有确定性和更一致的特性,适用于所有低于TM匹配阈值的文本片段。
  3. LLMs通过对部分翻译记忆匹配进行运行,自动调整它们到更新的源文本("模糊匹配自动修复"),同时根据翻译记忆条目以及公开可用的来源如公司网站所识别出的语调,调整NMT输出的样式。

一旦完成所有这些步骤,很可能会有人工审核员进行验证和优化该TM + NMT + LLM输出。

结论

ChatGPT,生成AI和LLMs周围的炒作很可能会陪伴我们相当长的时间,直到这些技术成为我们日常生活的一部分。很多人想在这种颠覆性技术的发展和适应中发挥作用,这是可以理解的。但作为一个翻译和翻译经理,我认为LLMs还不够先进,无法彻底改变翻译行业。毫无疑问,它们将会发挥作用,我们都需要关注最新的发展。目前,我的建议是:为了顾客的利益,请稳操胜券,但偶尔让你的翻译员试水LLMs。

2023-10-20 17:02:28 AI中文站翻译自原文