时间:2024-05-07
安帅飞 邵桢贻
内容摘要:机器翻译自诞生至今,历经半个多世纪,已然取得了长足的进步。当前,在处理新闻题材等规范化文本上,在线翻译平台效果可观,但对口语题、小说题等非规范化文本的翻译效果并不理想。本文以小说体裁为切入点,对Google翻译在线和多语种即时在线翻译_百度翻译两大在线翻译平台进行评测实验,通过观察分析实验结果,归纳总结错误原因,对该类体裁的翻译提出一些改进建议。
關键词:机器翻译 小说 Google翻译 百度翻译 评测实验
当前,随着计算能力的增长、算法的改进完善,经验主义导向下的机器翻译取得了显著的成就。Google等在线翻译平台对传统翻译行业造成了很大的冲击,甚至有取代翻译职业的舆论狂潮。但大规模的计算能力和不断升级的算法并非万能,在口语题、小说题等非规范本文上的翻译处理上,效果仍不理想。本文使用小说体裁对Google翻译在线和多语种即时在线翻译_百度翻译两大在线翻译平台进行评测实验,分析实验结果,力求提出改进翻译效果的刍议。
1.1实验所用语句
实验所用语句选自金庸所著《笑傲江湖》和《倚天屠龙记》共6句,体裁为小说。列举如下:
1.莫非是田伯光?又莫非是不戒和尚?
2.刘师叔金盆洗手大事,请暂行押后。
3.刘姑娘,请你在这里稍待片刻。
4.嵩山派来了多少弟子,大家一齐现身罢!
5.天下英雄在此,你胆敢动我儿一根寒毛,你数十名嵩山弟子尽皆身为肉泥。
6.多谢姑娘。
1.2实验所用翻译平台
①Google翻译在线http://translate.google.cn/
②多语种即时在线翻译_百度翻译http://fanyi.baidu.com/?aldtype=16047#auto/zh
2.1实验结果
将《笑傲江湖》和《倚天屠龙记》中所选的20句小说句放在两大在线翻译平台进行测试,得到结果如下:
1.Google:Could it be Tian Bo light? Is it not a monk?
百度:Could it be Tian Boguang?Is it possible not to quit monks?
2.Google:Liu Shishu gold basin wash your hand, please temporarily postponed.
百度:Uncle Liu wash event,please postpone the interim.
3.Google: Liu girl, please stay here for a moment.
百度:Liu Guniang, please stay here for a while.
4.Google: Songshan sent a number of disciples, everyone came together!
百度:Songshan sent a number of disciples, we all come together!
5.Google: The world heroes in this, you dare to move me a cold hair, you dozens of Songshan disciples as all as mud.
百度:Hero in the world here, you dare to move a finger on my son, you dozens of Songshan disciples all being minced meat.
6.Google: Thank the girl.
百度:Thank you girl.
2.2实验结果分析
经过观察分析,上述翻译大致出现了6类错误,分别如下:
①中文分词错误,导致错误断句,句子结构分析不正确。
例:嵩山派来了多少弟子,大家一齐现身罢!
Google:Songshan sent a number of disciples, everyone came together!
百度:Songshan sent a number of disciples, we all come together!
根据翻译结果可以判断得到,Google和百度翻译系统在处理该例句时,将专有名词“嵩山派”断句为:嵩山|派,误将‘派处理为动词,译为‘sent。词库中,专有名词“嵩山派”出现次数过少或缺失。
②人名等专有名词的翻译错误。
以例句1来进行说明。
例:莫非是田伯光?又莫非是不戒和尚?
Google:Could it be Tian Bo light? Is it not a monk?
百度:Could it be Tian Boguang?Is it possible not to quit monks?
例句中,‘田伯光、‘不戒和尚在小说中是人名,属于专有名词,在Google翻译平台中被错误翻译为‘Tian Bo ligh,‘not a monk(不一个和尚)。‘不戒和尚在百度翻译中被译为‘not to quit monks(不去放弃和尚)。
③隐喻、比喻等被直译成字面意义。
例:天下英雄在此,你胆敢动我儿一根寒毛,你数十名嵩山弟子尽皆身为肉泥。
Google:The world heroes in this, you dare to move me a cold hair, you dozens of Songshan disciples as all as mud.
百度:Hero in the world here, you dare to move a finger on my son, you dozens of Songshan disciples all being minced meat.
例句中‘一根寒毛、‘肉泥皆為隐喻用法,而在Google和百度翻译平台中被直译为‘a cold hair、‘minced meat等,明显偏离真实语义。
④成语、惯用语等被直译成字面意义。
例:刘师叔金盆洗手大事,请暂行押后。
Google:Liu Shishu gold basin wash your hand, please temporarily postponed.
百度:Uncle Liu wash event,please postpone the interim.
例句中,成语‘金盆洗手在Google翻译平台中被直译为‘gold basin wash your hand,明显偏离真实语义。在百度翻译平台被漏译为‘wash,也是错误的。
⑤在处理一词多义时,选择了错误的词义。
例:刘姑娘,请你在这里稍待片刻。
Google:Liu girl, please stay here for a moment.
百度:Liu Guniang, please stay here for a while.
例句中,‘姑娘为多义词,可以表示女孩,也可以用作称谓词。Google翻译平台,在词义优选过程中,选择了错误的词义‘girl。百度翻译平台则是直接给出了汉语拼音。
⑥复句的分句主语判断错误。
例:嵩山派来了多少弟子,大家一齐现身罢!
Google:Songshan sent a number of disciples, everyone came together!
百度:Songshan sent a number of disciples, we all come together!
例句中的第二个小句主语‘大家指嵩山派弟子,Google将其翻译为‘everyone,勉强可以接受,百度将其译为‘we,则明显是错误的。
对非规则文本处理上,詹卫东(2017)引入构式语法,提出通过构建构式知识库来搭建基础的语料资源。本文结合对实验结果的分析,根据对错误结果的特征分析,对改善小说题机器翻译提出三点建议。
(一)在通用翻译平台的基础上,增设领域翻译平台。
在专门领域翻译平台上,针对不同的领域,使用不同的知识库。这样,进行诸如例6一词多义的优先选择时,可能会出现不同的结果。在领域知识库中,‘姑娘一词中各个词义的优先级不一定等同于通用知识库。一般来看,在通用知识库中,‘姑娘的优先级应是:女孩(girl)>称谓词(Miss),而在小说体裁的知识库中,‘姑娘的优先级更可能是:称谓词(Miss)>女孩(girl)。
(二)丰富领域知识库。
在增设领域翻译平台的基础上,丰富知识库。主要有两个方面:
①是要增加人名、地名等专有名词,以解决分词错误、专名翻译错误等问题。
②是要增设成语、惯用语対译资源库,以避免字面直译,偏离真实含义。
(三)增设指代消解机制。
指代消解问题是自然语言处理不可回避的部分,汉语中的回指主要有三种形式:零形回指、代词回指和名词回指(陈平,1987)。其中,零形回指的出现频率最高,使用最广泛(黄娴,2009)。需要特别注意,回指的消解问题,不只出现在句间,也出现在单个句子内部(例句7)。在领域翻译平台上,增加指代消解机制,以判定代词等指示词的指示对象,明晰句子成分,消除歧义。
[1]詹卫东.从短语到构式:构式知识库建设的若干理论问题探析[J].中文信息学报,2017:31.
[2]陈平.汉语零形回指的话语分析[J].中国语文,1987,200(5):363-378.
[3]黄娴.汉语零形回指研究综述[J].中文信息学报,2009:23.
(作者单位:信息工程大学洛阳校区;天津工业大学)
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!