编者按
本文来自游戏本地化公司 Alconost 的官方博客,由 indienova 取得授权并译制发表,原文链接见文末。
- 原文作者:Alconost 官方博客
- 译者:Rumpleteazer
正文
机器学习几乎已经进入到各行各业,游戏本地化领域也不例外。尽管提供机器翻译产品的软件供应商宣传自家产品已经让本地化技术步入新的纪元,然而玩家却总还会期盼游戏发行商能在细节上再多花点心思。
作为一家正在面对再编辑机翻文本这类工作的专业本地化公司,Alconost 无法绕开这一话题。在本文中,我们会聊一聊有关机器翻译(MT)的方方面面,既包括热点,也包括冷门问题,并探讨如何在不牺牲质量的前提下,充分发挥它的作用。
果壳中的 NMT:NMT 究竟是什么?
本地化工作刚引入机器学习时便将其视为利器。很长一段时间里,本地化公司采用 PEMT 方案,即基于机翻的再编辑技术(post-edited machine translation),意思是先用机器翻译文本,再让译员审阅编辑。PEMT 的问题主要在于,机器不会比照前后文和术语表,而是“看”到哪里翻到哪里,这自然会造成大量错误,需要人工编辑介入。
随着时间推移和技术进步,神经机器翻译(下文称英文缩写 NMT,即 neural machine translation)登上历史舞台。这项技术被证明是一种更可靠也更稳健的解决方案。NMT 运用神经网络和深度学习,不仅能够翻译文本,实际上还能学习相关术语及其应用实例。如此,NMT 就比 PEMT 中运用的普通机器翻译要更加准确,而且,只要经过充分学习,它还能比人工翻译更快地提供高质量译文。
NMT 解决方案概述
不足为奇的是,市面上已有几十种现成的 NMT 解决方案。它们可以被划分为两大类:常规型 NMT 引擎和自定义 NMT 引擎。稍后我们再讨论自定义(或称专门型)NMT,现在让我们先专注于常规型 NMT 这一话题。
常规型 NMT 引擎基于通用翻译数据。该类数据集庞大且丰富(例如谷歌的数据库),却并不面向特定领域,也就是说,使用常规型 NMT 引擎只能让你大致了解文意,但却无法精准翻译出特定用语和词汇。
下面是常规型 NMT 引擎的一些例子:谷歌云翻译(Google Cloud Translation)、亚马逊翻译(Amazon Translate)、DeepL 翻译(DeepL Translator)、CrossLang、微软翻译(Microsoft Translator)、Intento、KantanMT。
这些引擎的主要优势在于,它们大多数都公开且免费(如谷歌翻译)。商用常规型 NMT 则提供订阅 API 与集成选项的付费服务。但是,以上这些常规型 NMT 引擎最大的不足之处在于,它们都没有考虑过游戏本地化的复杂性。下文会进行详细的说明。
游戏本地化的诸多复杂之处
尽管机器翻译在许多行业都表现得不错,却在游戏本地化领域碰了壁。主要的原因是,无论何种游戏,都以创造沉浸式体验为目的,而这种体验的核心部分则有赖于通顺自然的对白和游戏内文本。那么,要恰当地翻译这些内容,究竟有哪些挑战呢?
创造力
哪怕听起来有些绝对,但还是不得不说,在给游戏注入灵魂这件事上,创造力起到了巨大的作用,在翻译方面尤甚。译者可能灵光一现,就想出了意料之外的措辞,使得译文比原文更能引起玩家的共鸣。
机器可以变得有创造力吗?目前还不行。这也就意味着,机器翻译总是会缺少一些创意成分,而有时候,正是这些创意让游戏变得出彩。
特定的措辞、方言和俚语
本地化最大的挑战之一就是如何使译文尽可能自然。每个国家和地区都有特定的语言和方言,要想成功地进行翻译,必须对当地文化有透彻的了解。
就算我们可以在现成的数据库上训练机器学习解决方案,但如果遇到只有当地人才知道如何使用的高度特定的用语,该如何是好呢?这时,专业母语译者和来自社群的反馈就非常有帮助了。提到社区反馈,是指母语者提供的关于最佳措辞的建议,这类人群最了解自己语言的精妙之处。所以说,与语言打交道还需要培养语感,光有理论知识是不够的。
语气和整体氛围
特定词汇能够传达特定语气,通常,我们会凭感觉来措辞,无需动脑。在翻译一款游戏时,译员能够感知到游戏本身(或是某段对白)的整体氛围,从而使用能更好传达语气与情绪的同义词,而非简单地将原文词汇转换成译文。反之,机器则无法感知情绪,在某些情况下,翻译会显得不够自然。
案例快速研究一则:Full HP Ltd
Alconost 和手游工作室 Full HP 曾经合作过两个本地化项目,分别是英译韩(48926 字符)和英译日(57073 字符)。客户方提供机翻稿件,交给我们做译后编辑,然而英译韩的稿子实际上需要重新翻译,因为我们收到的机翻稿并没有正确地处理对白,有些部分没能正确地复用文本。客户同意了这项方案,选择付出更多的时间与精力,却也收获了质量更高的本地化成果,玩家也感到满意。Full HP 巧妙权衡,使用第三方机器翻译通用语和简单用语,其余内容交由我们的在线人工翻译平台 Nitro 处理,最终将应用内转化率提高了约 25%。
在游戏本地化中应用机器翻译的优势
尽管游戏本地化挑战重重,但机器翻译目前的表现仍然可圈可点。由于存在一些明显优势,面对某些任务时,这项技术便成为了不错的选择。
速度
速度可以说是机器翻译最大的优势,也是其独特卖点。译员要花上几天甚至几周才能完成的大量文本翻译,机器只需要几分钟。在许多情况下,先机翻再编辑是更快更高效的方式。此外,若想快速发布更新,又要保证翻译质量“不至于太差”,那么以快取胜的机翻也足够方便。
游戏外文本的翻译
谈及游戏本地化,首先会想到的通常是游戏内的对话翻译,可本地化远不止于此,它还得涵盖用户手册、操作流程、文章、指南和宣传材料。这类文案并没有太多需要发挥创意和表达意象的地方,不会对游戏的沉浸体验造成实际影响。即便玩家在博客文章里挑出了错误,也不大可能影响其游戏体验。
成本
机器翻译的另一大优势是相对低廉的成本。相比雇佣专业译员所需的费用,机器翻译往往更加经济实惠。这样一来,在节省开支的同时,还能把其他更重要的任务分配给专业人士。
译文一致性
机器翻译还能在译文一致性方面惠及项目。当好几个的译员处理同一篇文本时,可能会出现“同一用语,不同译法”,导致翻文不一致。而机器翻译却能确保重复用语有固定译法,进而提高文本一致性。
那么,机翻对游戏来说够好吗?
根据玩家群体的说法,机翻显然并不是百分之百准确。比如,最近的一篇 Reddit 帖子里,就有沮丧的玩家留下上百条评论,大部分都在说同一件事:厂商只想挣快钱,没考虑砸钱做好翻译。那么,什么样的翻译手段产出又快,质量又“不至于太差”?你想得没错,就是机器翻译。
不幸的是,厂商匆匆上架游戏,不仅会带来糟糕的用户体验,也会连累自己的品牌忠诚度大幅下降。许多玩家将翻译糟糕视为游戏厂商最大的缺陷之一。
如果谷歌机翻也不顶用,那还有什么选择呢?下述方法或许最为有效。
本地化专用的 NMT
虽然 NMT 有一定瑕疵,但瑕不掩瑜。它迅速且相对准确,如果需要快速翻译大量文档(如用户手册),NMT 其实能帮上大忙。所以,我们认为完美的解决方案是,使用面向特定领域、专用于本地化的 NMT(或说自定义 NMT)。让我们以自身业务为例来说明。
Alconost 目前正在开发一项产品,使用神经机器学习,还支持庞大的多语种翻译数据库。这使得我们能够实现更高的准确性,不仅适用于一般领域翻译,还能进行游戏本地化——这两者有很大区别。此外,Alconost 还使用具有开源数据的云平台(如 Crowdin 和 GitLocalize),如此一来,某一项目的术语表和翻译记忆就可以为另一项目所用。因为有着持续的数据交换和收集,Alconost 已经构建并将持续打造一个非常专门且稳健的数据库,专用于游戏本地化。当然,我们的译员也会对文本进行译后编辑,以确保翻译正确。
由于自定义领域适应性 NMT 解决方案在设计时考虑到了特定的领域,或将成为本地化行业的里程碑。这种解决方案最大的优势在于,翻译高度准确、速度快、价格实惠(相比聘用专业译者会更便宜),还能选择探索新的特定领域。
某些内容,比如用户评论,有时不会着手进行翻译,因为它们过于具体且为数不多。用常规 NMT 引擎翻译它们也没有什么意义,还会造成繁重的译后再编辑工作。
不过,经过一番设计,自定义 NMT 工具就可以用来翻译用户评论,还能“理解”其中的语气,即便是如此专门的内容,也可以用机翻处理。爱彼迎(Airbnb)已经在使用这项解决方案了,只需按下“翻译”键,房客评价以及其他由用户留下的内容就会瞬间得到翻译。
此外,机翻引擎还能接受情绪识别训练,并搭配机器学习分类器,对反馈进行标记和优先级排序。这项功能也能用来收集用户在线行为数据,这些数据对任何公司来说,都是非常宝贵的资产。
机器翻译与传统本地化有何不同?
最后,我们来聊聊基于机翻文本进行本地化的复杂之处,以及这一过程与通常的本地化流程有何不同。我们会基于过往不同项目上积累的经验,对这两种解决方案进行一番对比。
过程
当我们从零开始处理本地化项目时,由于团队一开始就有术语表和上下文语境,因此,可以肯定地说,我们牢牢把控着项目质量。而且,译员都会根据稿件所属领域来处理文本,所以极少需要进行译后编辑。
机器翻译就不一样了,源文本有可能来自不同的翻译引擎,每个引擎的质量与准确度都参差不齐。所以,在拿到机翻稿件后,为确保译文符合其领域与品牌风格,必须向客户要来所有的翻译材料(风格指南、术语表等)。换言之,机器翻译的译后编辑还有一个额外步骤,即评估机翻项目的质量和准确度。
团队
本地化团队的组建方式可能因公司而异,主要取决于业务重心、流程、可用资源、机翻方案的质量以及其他内部因素。在此,我们想要分享 Alconost 的方法,我们力求灵活,但并非处处以其为先。
目前,Alconost 采用的是传统本地化方法,即人工翻译和人工编辑。但未来我们计划推出一项新的专门型 NMT 服务,项目团队也可能随之改变,译员和编辑会减少,转而增加数据科学家和工程师的数量。
质量
99%的情况下,本地化的传统做法都是把项目分配给精通目标语言和稿件领域的译员,但如果是机翻,其训练程度如何、拥有多少语种的数据,都无从确定。以西班牙语译英语为例,引擎 A 的学习量达到了一万页,引擎 B 的是一百万页,显然引擎 B 的翻译会更准确。
至少,由专业本地化公司针对专门领域“训练”出的机翻引擎可以实现足够的“精通度”,从而确保译文的质量。无需担心,有了足量的翻译数据和专业的语言编辑,自能妥善管理项目。
编者附注
本文作者来自 Alconost,作为一家以人工翻译为主要工作模式的专业本地化公司,一方面,他们在过往项目中参与了不少机翻润色工作;另一方面,他们也在积极探索基于深度神经网络的机器翻译在游戏本地化领域的前景。
这篇文章介绍了机器翻译应用于游戏本地化领域所面对的挑战以及它的优劣势,实际的写作重心是“为什么机器翻译足够好”,这可能与玩家普遍感受“为什么机器翻译不够好”恰恰相反。我们不妨展开讨论一下,为什么会有这种感受上的明显差异。让我们沿着文章脉络稍作总结,也就文中没有深入涉及到的若干问题稍作补充,以探讨为何存在上述争议。
本文总结机翻的劣势,提到以下几点:
- 缺乏创造力;
- 无法驾御特定领域;
- 难以把握情感氛围和语气;
- 在流程管理上,团队缺乏人工控制;
- 不同训练程度的机器翻译水平不一。
对第一点,文章坦言目前的机器学习还无法做到。针对第二到第五点,文章多处强调专用自定义的 NMT 方案已经能在相当程度上给予弥补,并得出这样的初步结论:
基于目标领域数据给予充分训练的机翻引擎,已足以胜任要求不至于过高的翻译任务,不但能比常规方式更快捷高效,还能“理解”特定上下文与专门领域的内容,结合译后校润,往往还能达成更好的翻译结果。
以上结论在文中背景看,似乎没有太大问题,但实践上,其实很难设想有这样的理想状态。我们可以想象,至少以下情况会令结果事与愿违:
一,对足够好的标准判断不尽相同。机器翻译总会造成“足够多”降低质量的问题,不适用于质量标准要求高的场合。目前,哪怕足够好的机器翻译已经能够针对特定领域“理解”上下文的含义,并且“理解”句子的感情色彩,但翻译质量与优质译者流利自然的译文依然存在肉眼可见的差距。如果仅仅满足于“足够好”,那么势必会牺牲原文一部分文学内涵与情感价值,对某些受众来说,这就是“不够好”。正如文中所说:机器翻译不断进步,但“玩家却总还会期盼游戏发行商能在细节上再多花点心思”。
二,在目前的业界实践中,并没有大范围应用“足够好”的机器翻译引擎。机器翻译的最主要优势在于速度快捷、成本低廉,如果厂商已经将成本和效率视为最优先考虑项,选择使用机翻,那么最有可能采用的是那些公开、免费的通用型机器翻译引擎,而对能显著提高质量却会大幅增加成本的补充方案,却很有可能会视而不见。
三,在不计较成本或尽可能追求完美的场合,目前缺乏引入机器翻译的必要性。在高标准的翻译实践中,运用机器翻译,其实总是会引入更多质量问题,从而增加后续编辑校审的压力。最终,是否能真正降本增效,是否不会给最终质量造成负面影响,都要结合项目实际情况作具体分析。总的来说,机器翻译这项方案有利有弊,并非万金油。
机器翻译究竟能否发挥正向的价值,也要看具体应用场合。不同游戏类型对翻译质量的要求跨度很大,叙事类游戏可能机翻暂时无法胜任,文本较少的某些 Roguelike 类游戏机翻或可勉强处理。翻译方式的选择,都是成本、效率、呈现效果综合考虑后的决定。
AI 技术的发展进步速度超越普罗大众的想象。作为一种“创造性”劳动的“翻译”活动自然不应该排斥技术的辅助,但是,这项工作今后是否会完全被 AI 技术替代,暂时还无法看到端倪。实事求是地讲,“机器翻译”当然不是一无是处,可以结合项目需求适当应用。并且,我们也有理由相信,随着技术发展进步,它还会获得比现在更加广阔的应用场景。就此,本文给出了颇具建设性的参考方案。只是,论采取何种方案,最重要的还是尊重游戏这门艺术,尊重创作者的劳动成果。毕竟,玩家的反馈是真实有效的,会明确无误地告诉我们,到底“机器翻译够不够好”。
原链接:https://alconost.medium.com/machine-translation-for-game-localization-3d49bb6c93b0
Alconost 是一家游戏本地化服务提供商。主要业务包括超过 100 种语言的游戏本地化服务,帮助开发者将本地化整合到游戏开发过程中,并执行游戏本地化测试。
*本文内容系作者独立观点,不代表 indienova 立场。未经授权允许,请勿转载。
暂无关于此文章的评论。