机器翻译译文质量评估方法及装置制造方法及图纸

技术编号:38602893 阅读:11 留言:0更新日期:2023-08-26 23:36
本发明专利技术提供一种机器翻译译文质量评估方法及装置,所述方法包括:获取对目标原文进行机器翻译所得到的目标译文;确定所述目标译文与所述目标原文的相似度特征;确定所述目标译文的语法错误特征;确定所述目标原文的第一流畅度特征;确定所述目标译文的第二流畅度特征;基于所述相似度特征、所述语法错误特征、所述第一流畅度特征和所述第二流畅度特征,确定所述目标译文的预测质量等级。本发明专利技术的机器翻译译文质量评估方法,通过从原文与译文之间相似度、译文的语法错误、原文以及译文的流畅度这些维度来对机器翻译得到的目标译文进行质量评价,能够更加全面并准确地对机器翻译译文进行质量评估。进行质量评估。进行质量评估。

【技术实现步骤摘要】
机器翻译译文质量评估方法及装置


[0001]本专利技术涉及文本处理
,尤其涉及一种机器翻译译文质量评估方法及装置。

技术介绍

[0002]当前机器翻译引擎作为人工翻译的助手,在翻译活动中被广泛应用。然而机器翻译引擎的翻译结果质量良莠不齐,经常出现错译,漏译,增译的现象,其中又涉及到字词句不同级别的各种问题。如果每句译文由人工再次评估一遍的话,则相比纯人工翻译,更加降低了整体翻译流程的效率和提高了人工的成本。现有的译文质量评估方法通过学习译员打标的质量标签结果对译文质量进行预测,然而准确率较低,不仅十分依赖大量的专业的人工标注数据,而且缺乏一定的可解释性,无法让人理解译文质量高低的依据。所以,如何更加准确地、可理解地判断一句机器翻译译文的质量高低,以使得机器翻译引擎更好地辅助翻译、加快翻译流程及提高翻译效率是一个亟需解决的问题。

技术实现思路

[0003]本专利技术提供一种机器翻译译文质量评估方法及装置,用以解决现有技术中机器翻译译文质量难以准确评估的缺陷,实现更好地辅助翻译、加快翻译流程及提高翻译效率的效果。
[0004]本专利技术提供一种机器翻译译文质量评估方法,包括:
[0005]获取对目标原文进行机器翻译所得到的目标译文;
[0006]确定所述目标译文与所述目标原文的相似度特征;确定所述目标译文的语法错误特征;确定所述目标原文的第一流畅度特征;确定所述目标译文的第二流畅度特征;
[0007]基于所述相似度特征、所述语法错误特征、所述第一流畅度特征和所述第二流畅度特征,确定所述目标译文的预测质量等级。
[0008]根据本专利技术提供的一种机器翻译译文质量评估方法,所述确定所述目标译文与所述目标原文的相似度特征,包括:
[0009]分别确定所述目标译文与所述目标原文中各语句所对应的表征向量;
[0010]将所述目标译文与所述目标原文中各语句所对应的表征向量之间的余弦相似度确定为所述目标译文与所述目标原文的相似度特征。
[0011]根据本专利技术提供的一种机器翻译译文质量评估方法,所述确定所述目标译文的语法错误特征,包括:
[0012]将所述目标译文输入至语法纠错模型,得到所述语法纠错模型输出的对所述目标译文各词的纠错操作的表征向量;
[0013]将所述目标译文各词的纠错操作的表征向量叠加,得到所述语法错误特征;
[0014]其中,所述语法纠错模型是以样本译文和所述样本译文对应的审校译文为样本集训练得到的。
[0015]根据本专利技术提供的一种机器翻译译文质量评估方法,所述确定所述目标原文的第一流畅度特征,包括:
[0016]将所述目标原文输入至所述第一流畅度检测模型,得到所述第一流畅度检测模型输出的所述第一流畅度特征;
[0017]所述确定所述目标译文的第二流畅度特征,包括:
[0018]将所述目标译文输入至所述第二流畅度检测模型,得到所述第二流畅度检测模型输出的所述第二流畅度特征。
[0019]根据本专利技术提供的一种机器翻译译文质量评估方法,所述基于所述相似度特征、所述语法错误特征、所述第一流畅度特征和所述第二流畅度特征,确定所述目标译文的预测质量等级,包括:
[0020]将所述相似度特征、所述语法错误特征、所述第一流畅度特征和所述第二流畅度特征进行特征拼接,得到所述目标译文的拼接特征向量;
[0021]将所述拼接特征向量输入至质量评价模型,得到所述质量评价模型输出的所述目标译文的预测质量等级;
[0022]其中,所述质量评价模型是以样本译文为样本、以所述样本译文对应的质量等级为标签训练得到的。
[0023]根据本专利技术提供的一种机器翻译译文质量评估方法,所述样本译文对应的质量等级通过以下方式确定:
[0024]确定所述样本译文对应的审校译文;
[0025]以句为单位确定所述样本译文与所述审校译文之间的编辑距离;
[0026]基于所述编辑距离,划分所述样本译文对应的质量等级。
[0027]本专利技术还提供一种机器翻译译文质量评估装置,包括:
[0028]获取模块,用于获取对目标原文进行机器翻译所得到的目标译文;
[0029]第一处理模块,用于确定所述目标译文与所述目标原文的相似度特征;确定所述目标译文的语法错误特征;确定所述目标原文的第一流畅度特征;确定所述目标译文的第二流畅度特征;
[0030]第二处理模块,用于基于所述相似度特征、所述语法错误特征、所述第一流畅度特征和所述第二流畅度特征,确定所述目标译文的预测质量等级。
[0031]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述机器翻译译文质量评估方法。
[0032]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述机器翻译译文质量评估方法。
[0033]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述机器翻译译文质量评估方法。
[0034]本专利技术提供的机器翻译译文质量评估方法及装置,通过从原文与译文之间相似度、译文的语法错误、原文以及译文的流畅度这些维度来对机器翻译得到的目标译文进行质量评价,能够更加全面并准确地对机器翻译译文进行质量评估,以使得机器翻译引擎更好地辅助翻译、加快翻译流程及提高翻译效率。
附图说明
[0035]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0036]图1是本专利技术提供的机器翻译译文质量评估方法的流程示意图之一;
[0037]图2是本专利技术提供的机器翻译译文质量评估方法的流程示意图之二;
[0038]图3是本专利技术提供的机器翻译译文质量评估装置的结构示意图;
[0039]图4是本专利技术提供的电子设备的结构示意图。
具体实施方式
[0040]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术中的附图,对本专利技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0041]下面结合图1

图4描述本专利技术的机器翻译译文质量评估方法及装置。
[0042]本专利技术实施例的机器翻译译文质量评估方法的执行主体可以是处理器,当然,在一些实施例中,执行主体还可以是服务器,此处不作限制。下面以处理器为例,来对本专利技术实施例的机器翻译译文质量评估方法进行说明。
[0043]本专利技术实施例的机器翻译译本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种机器翻译译文质量评估方法,其特征在于,包括:获取对目标原文进行机器翻译所得到的目标译文;确定所述目标译文与所述目标原文的相似度特征;确定所述目标译文的语法错误特征;确定所述目标原文的第一流畅度特征;确定所述目标译文的第二流畅度特征;基于所述相似度特征、所述语法错误特征、所述第一流畅度特征和所述第二流畅度特征,确定所述目标译文的预测质量等级。2.根据权利要求1所述的机器翻译译文质量评估方法,其特征在于,所述确定所述目标译文与所述目标原文的相似度特征,包括:分别确定所述目标译文与所述目标原文中各语句所对应的表征向量;将所述目标译文与所述目标原文中各语句所对应的表征向量之间的余弦相似度确定为所述目标译文与所述目标原文的相似度特征。3.根据权利要求1所述的机器翻译译文质量评估方法,其特征在于,所述确定所述目标译文的语法错误特征,包括:将所述目标译文输入至语法纠错模型,得到所述语法纠错模型输出的对所述目标译文各词的纠错操作的表征向量;将所述目标译文各词的纠错操作的表征向量叠加,得到所述语法错误特征;其中,所述语法纠错模型是以样本译文和所述样本译文对应的审校译文为样本集训练得到的。4.根据权利要求1所述的机器翻译译文质量评估方法,其特征在于,所述确定所述目标原文的第一流畅度特征,包括:将所述目标原文输入至所述第一流畅度检测模型,得到所述第一流畅度检测模型输出的所述第一流畅度特征;所述确定所述目标译文的第二流畅度特征,包括:将所述目标译文输入至所述第二流畅度检测模型,得到所述第二流畅度检测模型输出的所述第二流畅度特征。5.根据权利要求1

4中任一项所述的机器翻译译文质量评估方法,其特征在于,所述基于所述相似度特征、所述语法错误特征、所述第一流畅度特征和所...

【专利技术属性】
技术研发人员:闫泽禹
申请(专利权)人:传神语联网网络科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1