当前位置: 首页 > 专利查询>南京大学专利>正文

利用检索提升机器翻译质量自动评估的方法、介质及设备技术

技术编号:34520046 阅读:30 留言:0更新日期:2022-08-13 21:09
本发明专利技术公开了一种利用检索提升机器翻译质量自动评估的方法、介质及设备,方法包括:检索阶段:对于机器翻译质量评估句对,为所述机器翻译质量评估句对中的待评估词在数据库中检索出相关的平行句对;机器翻译质量评估阶段:将检索到的平行句对进行编码后,融入到机器翻译质量评估模型中。本发明专利技术能够直接有效地利用相关的平行句对,同时也缓解了机器翻译质量评估训练数据稀疏的问题;更好地解释了模型做出相关决策的原因;无需重新训练模型;避免了端到端模型在训练过程中遗忘训练数据的缺陷,提升了机器翻译质量评估模型的性能。提升了机器翻译质量评估模型的性能。提升了机器翻译质量评估模型的性能。

【技术实现步骤摘要】
利用检索提升机器翻译质量自动评估的方法、介质及设备


[0001]本专利技术涉及自然语言处理
,具体涉及一种利用检索提升机器翻译质量自动评估的方法、介质及设备。

技术介绍

[0002]随着当今社会全球化趋势的加速发展,机器翻译技术作为连接不同语言之间的桥梁变得至关重要。但目前机器翻译的质量相较于人类的翻译仍有一些差距,因此需要对其进行质量评估,进而帮助人类更好地利用机器翻译的结果。将质量评估的工作同样交由机器来做,就是机器翻译质量的自动评估。近年来,机器翻译质量自动评估受到越来越多的关注,已经成为了机器翻译领域一个被广泛研究和讨论的问题。
[0003]目前,机器翻译质量的自动评估大致可以分为两个方向,第一个是有参考译文的机器翻译质量评估,也就是通过比对机器翻译系统的输出和参考译文给出一个可以量化的指标,经典的工作如BLEU【文献Kishore Papineni,SalimRoukos,Todd Ward,and Wei

Jing Zhu.2002.BLEU:a method forautomatic evaluation of machine translation.(BLEU:一种机器翻译自动评估的方法)Proceedings of the 40th Annual Meeting on Associationfor Computational Linguistics:311

318.】,METEOR【文献Alon Lavieand Abhaya Agarwal.2007.Meteor:an automatic metric for MTevaluation with high levels of correlation with human judgments. (Meteor:一个与人类的判断具有高度的相关性的用于机器翻译评估的自动指标。)Proceedings of the 45th Annual Meeting on Association forComputational Linguistics:228

231.】等。
[0004]而更通用的情况是第二个方向,即无参考译文的机器翻译质量评估。在只给定一个双语句对,包括一个源端句子和一个机器翻译系统的翻译的情况下,由质量评估系统自动地判断翻译的质量。在该任务中对于翻译质量的评估分别包括词级别以及句子级别,其中词级别的质量评估需要去判断翻译中每个词的翻译好坏,而句子级别则是和前述的方向一样需要给出一个分数说明翻译的整体好坏。目前对于该任务的做法是由人工标注一些样例,将该问题视作一个有监督的学习预测任务,而后通过深度网络模型进行学习。
[0005]目前机器翻译质量评估的有效标注数据非常稀少,在公开的数据集中,一个语言对的数据往往只有数千条。为了缓解数据稀疏的问题,目前的研究者尝试借助外部资源来帮助机器翻译质量评估任务的训练。目前常用的方式大致有两种,一是借助大规模跨语言预训练模型,以预训练模型作为基础,再使用机器翻译质量评估的监督数据进行微调【文献Tharindu Ranasinghe, Constantin Orasan,and Ruslan Mitkov.2020.TransQuest:TranslationQuality Estimation with Cross

lingual Transformers.(TransQuest:使用跨语言Transformers来进行翻译质量评估)Proceedings of the 28thInternational Conference on Computational Linguistics:5070

5081.文献Tharindu Ranasinghe,Constantin Orasan,and Ruslan Mitkov.2021. An Exploratory Analysis of Multilingual Word

Level QualityEstimation with Cross

Lingual Transformers.
(用跨语言Transformers进行多语言词级别质量评估的探索性分析。)Proceedings of the 59thAnnual Meeting of the Association for Computational Linguistics andthe 11th International Joint Conference on Natural LanguageProcessing:434

440.】;二是借助大规模的平行语料,通过平行语料生成伪造的机器翻译质量评估数据来对原数据进行补充【文献Cui,Qu,ShujianHuang,Jiahuan Li,Xiang Geng,Zaixiang Zheng,Guoping Huang,andJiajun Chen."Directqe:Direct pretraining for machine translationquality estimation.(DirectQE:用于机器翻译质量评估的直接预训练。)" In Proceedings of the AAAI Conference on Artificial Intelligence, vol.35,no.14,pp.12719

12727.2021.文献Zheng,Yuanhang,ZhixingTan,Meng Zhang,Mieradilijiang Maimaiti,Huanbo Luan,Maosong Sun, Qun Liu,and Yang Liu."Self

Supervised Quality Estimation forMachine Translation.(基于自监督方法的机器翻译质量评估)"InProceedings of the 2021Conference on Empirical Methods in NaturalLanguage Processing,pp.3322

3334.】。
[0006]尽管这两类方法都有效地提高了机器翻译质量评估的性能,但它们仍然是完全基于黑盒的深度神经网络进行端到端的训练和预测,因此在可解释性和灵活性上都有所欠缺,同时对于外部平行数据的利用也不够完备。
[0007]首先是可解释性,对于机器翻译的质量评估而言,当评估模型给出一个翻译的词是OK或者BAD时,人实际上同样希望它能给出做判断的原因,这样能使得模型给出的预测的可信度更高,同时也使得人对模型做出的判断有更好的取舍。但显然目前深度神经模型的黑盒性质使得现有模型在输出结果的可解释性上有较大的欠缺。
[0008]其次是灵活性,目前的机器翻译质量评估模型通常是一次训练好后就应用于所有后续的机器翻译质量评估中,这样的做法本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.利用检索提升机器翻译质量自动评估的方法,其特征在于,包括:检索阶段:对于机器翻译质量评估句对,为所述机器翻译质量评估句对中的待评估词在数据库中检索出相关的平行句对;机器翻译质量评估阶段:将检索到的平行句对进行编码后,融入到机器翻译质量评估模型中。2.根据权利要求1所述的利用检索提升机器翻译质量自动评估的方法,其特征在于,所述检索阶段包括以下步骤:步骤1:使用平行句对构造数据库;步骤2:对于机器翻译质量评估句对,在所述数据库中对所述机器翻译质量评估句对中的待评估词构造查询序列,进行检索;步骤3:对于机器翻译质量评估句对中的待评估词,将其检索到的平行句对进行排序后,保留其中所需要的平行句对。3.根据权利要求1或2所述的利用检索提升机器翻译质量自动评估的方法,其特征在于,对于所有的平行句对,所述数据库为每一个平行句对中的每个词都构造倒排索引,即当搜索某个平行句对中的任意词时,都能检索到这个平行句对。4.根据权利要求1所述的利用检索提升机器翻译质量自动评估的方法,其特征在于,所述机器翻译质量评估阶段包括以下步骤:步骤4:将机器翻译质量评估句对和其待评估词对应检索到的平行句对分别使用跨语言预训练模型进行编码,分别获取所述机器翻译质量评估句对中待评估词的隐层表示和所述检索到的平行句对的隐层表示;步骤5:将所述待评估词对应的检索到的平行句对得到的隐层表示拼接起来;步骤6:使用所述机器翻译质量评估句对中待评估词的隐层表示对步骤5中拼接后的隐层表示使用多头注意力进行信息提取;步骤7:将所述机器翻译质量评估句对中待评估词的隐层表示和步骤6中基于信息提取后的隐层表示通过一种门控机制进行融合,得到最终的表示输入进多层感知机中进行分类,得到该待评估词的翻译准确性。5.根据权利要求1或2所述的利用检索提升机器翻译质量自动评估的方法,其特征在于,所述检索阶段具体包括以下步骤:步骤11:所述数据库通过Lucene构造搜索引擎,所述Lucene使用FST结构构造索引,为前缀相同的词共享索引路径,即给定一个平行句对,所述Lucene为所述平行句对中包括源语言和目标语言的每一个词构造倒排索引;步骤12:假设机器翻译质量评估句对为:X=(x1,...,x
i
,...,x
m
),翻译为:Y=(y1,...,y
j
,...,y
n
),对于机器翻译质量评估句对中的待评估词y
j
,所述查询序列为:MUST(y
j
)∧SHOULD(x1)∧...∧SHOULD(x
m
)∧SHOULD(y1)∧...∧SHOULD(y
n
);步骤13:对于待评估词,将其所有检索到的平行句对使用BM25进行排序,保留所需要的其中的top

k个结果;所述BM25的计算公式如下:
其中Q为待评估的机器翻译质量评估句对,q
i
表示该机器翻译质量评估句对中的每个词,而d则表示检索出的数据库中的一个平行句对,R...

【专利技术属性】
技术研发人员:黄书剑郑鑫赵千锋戴新宇张建兵陈家骏
申请(专利权)人:南京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1