翻译效果评估方法、装置、电子设备和存储介质制造方法及图纸

技术编号:31501934 阅读:24 留言:0更新日期:2021-12-22 23:20
本申请实施例公开了一种翻译效果评估方法、装置、电子设备和存储介质;对原文进行翻译处理,得到多个候选译文以及每个候选译文对应的准确度评分;根据准确度评分以及预设排序规则,对多个候选译文进行排序,得到第一排序序列;根据翻译质量评估指标对每个候选译文进行评估,得到每个候选译文对应的质量评估分;根据质量评估分以及预设排序规则,对多个候选译文进行排序,得到第二排序序列;计算第一排序序列与第二排序序列之间的误差值;展示误差值,以便用户获取翻译处理的翻译效果。该误差值可以反映出翻译处理步骤对多个候选译文做出的准确度评分的准确程度,与现有技术不对准确度评分进行评估相比,本申请对翻译效果的评估更为全面。估更为全面。估更为全面。

【技术实现步骤摘要】
翻译效果评估方法、装置、电子设备和存储介质


[0001]本申请涉及计算机领域,具体涉及一种翻译效果评估方法、装置、电子设 备和存储介质。

技术介绍

[0002]现有的机器翻译模型在进行翻译时,往往是先对原文进行翻译,得到多个 候选的翻译译文;然后机器翻译模型从多个候选的翻译译文中,选出模型自身 认为的最准确的翻译译文,并将该翻译译文输出。
[0003]然而,机器翻译模型选出的翻译译文不一定是最准确的。因此,现有技术 依据机器翻译模型输出的翻译译文对机器翻译模型翻译效果进行评估的方法 依据单一,不够全面。

技术实现思路

[0004]本申请实施例提供一种翻译效果评估方法、装置、电子设备和存储介质, 可以改善现有技术对翻译效果的评估方法不全面的问题。
[0005]本申请实施例提供一种翻译效果评估方法,包括:对原文进行翻译处理, 得到此次翻译处理获取的多个候选译文以及每个所述候选译文对应的准确度 评分,其中,所述准确度评分为所述翻译处理确定出的反映对应的所述候选译 文的翻译准确度的得分;
[0006]根据所述准确度评分以及预设排序规则,对所述多个候选译文进行排序, 得到第一排序序列;
[0007]根据翻译质量评估指标对每个所述候选译文进行评估,得到每个所述候选 译文对应的质量评估分,其中,所述翻译质量评估指标是衡量候选译文与标准 译文匹配程度的指标;
[0008]根据所述质量评估分以及所述预设排序规则,对所述多个候选译文进行排 序,得到第二排序序列;
[0009]计算所述第一排序序列与所述第二排序序列之间的误差值,其中,所述误 差值反映所述翻译处理的翻译效果;
[0010]展示所述误差值,以便用户获取所述翻译处理的翻译效果。
[0011]本申请实施例还提供一种翻译效果评估装置,包括:候选译文获取单元, 用于对原文进行翻译处理,得到此次翻译处理获取的多个候选译文以及每个所 述候选译文对应的准确度评分,其中,所述准确度评分为所述翻译处理确定出 的反映对应的所述候选译文的翻译准确度的得分;
[0012]第一排序单元,用于根据所述准确度评分以及预设排序规则,对所述多个 候选译文进行排序,得到第一排序序列;
[0013]质量评估单元,用于根据翻译质量评估指标对每个所述候选译文进行评 估,得到每个所述候选译文对应的质量评估分,其中,所述翻译质量评估指标 是衡量候选译文与标
准译文匹配程度的指标;
[0014]第二排序单元,用于根据所述质量评估分以及所述预设排序规则,对所述 多个候选译文进行排序,得到第二排序序列;
[0015]误差计算单元,用于计算所述第一排序序列与所述第二排序序列之间的误 差值,其中,所述误差值反映所述翻译处理的翻译效果;
[0016]误差值展示单元,用于展示所述误差值,以便用户获取所述翻译处理的翻 译效果。
[0017]在一些实施例中,所述原文包括l个词组,所述多个候选译文包括k个候 选译文;所述候选译文获取单元,包括:
[0018]备选词组确定子单元,用于根据所述原文以及k个所述已经生成的前i

1个 词组,确定多个备选词组以及每个所述备选词组作为第i个词组的概率值,其 中,i为大于1且不大于l的正整数;
[0019]概率值选择子单元,用于从多个所述概率值中选择出满足预设要求的k个 概率值,并得到k个概率值分别对应的第i个词组;
[0020]词组组合子单元,用于将k个所述第i个词组与各自的前i

1个词组组合,得 到k个前i个词组;
[0021]备选词组确定子单元、概率值选择子单元以及词组组合子单元依次重复执 行上述步骤,可以得到k个候选译文;
[0022]评分计算子单元,用于对于k个候选译文中的每个候选译文,根据组成所 述候选译文的多个词组的概率值,计算该候选译文对应的准确度评分。
[0023]在一些实施例中,备选词组确定子单元,具体用于对于k个已经生成的前 i

1个词组中的每个已经生成的前i

1个词组,根据所述原文以及所述已经生成 的前i

1个词组,计算词表中a个备选词组的每个词组作为第i个词组的概率值, 共得到k*a个概率值,其中,所述词表包括a个备选词组,a为正整数;
[0024]概率值选择子单元,具体用于从k*a个概率值中选择出满足预设要求的k 个概率值,并得到k个概率值分别对应的第i个词组。
[0025]在一些实施例中,概率值选择子单元,包括:
[0026]概率值序列次子单元,用于对所述k*a个概率值,按照数值从大到小的顺 序进行排序,得到概率值序列;
[0027]概率值截取次子单元,用于从所述概率值序列截取前k个概率值。
[0028]在一些实施例中,概率值选择子单元,包括:
[0029]概率值平均次子单元,用于计算所述k*a个概率值的平均值;
[0030]随机选择次子单元,用于从所述k*a个概率值中随机选择k个大于所述平均 值的概率值。
[0031]在一些实施例中,评分计算子单元,具体用于计算组成所述候选译文的多 个词组的概率值的乘积,所述乘积为该候选译文对应的准确度评分。
[0032]在一些实施例中,评分计算子单元,具体用于对组成所述候选译文的多个 词组中的每个词组的概率值进行对数运算,得到多个对数运算结果;
[0033]计算所述多个对数运算结果的加和,所述加和为该候选译文对应的准确度 评分。
[0034]在一些实施例中,候选译文获取单元,包括:
[0035]全局译文确定子单元,用于确定全部a
l
个候选译文,以及每个所述候选译 文对应的概率值,其中,对于l个词组中除最后一个词组外的每个词组,均有a 个备选词组作为所述词组的后接词组、以及每个所述备选词组作为所述后接词 组的概率值,所述词表包括a个备选词组,a为正整数;
[0036]全局截取子单元,用于对a
l
个所述概率值按照从大到小的顺序进行排序, 并截取前k个概率值以及前k个概率值分别对应的候选译文。
[0037]在一些实施例中,质量评估单元,包括:
[0038]命中子单元,用于对于每个所述候选译文,计算所述候选译文中的连续n 个单词组成的词组在所述标准译文中的命中次数,记为目标命中次数,其中, n为正整数;
[0039]目标个数子单元,用于计算所述连续n个单词组成的词组在所述候选译文 中的个数,记为目标个数;
[0040]目标比值子单元,用于计算所述目标命中次数与所述目标个数的目标比 值,所述目标比值反映所述候选译文与所述标准译文基于所述连续n个单词组 成的词组的匹配程度;
[0041]评估分确定子单元,用于根据反映所述原文的单词量的参数、以及所述目 标比值,确定所述候选译文对应的质量评估分。
[0042]在一些实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种翻译效果评估方法,其特征在于,包括:对原文进行翻译处理,得到此次翻译处理获取的多个候选译文以及每个所述候选译文对应的准确度评分,其中,所述准确度评分为所述翻译处理确定出的反映对应的所述候选译文的翻译准确度的得分;根据所述准确度评分以及预设排序规则,对所述多个候选译文进行排序,得到第一排序序列;根据翻译质量评估指标对每个所述候选译文进行评估,得到每个所述候选译文对应的质量评估分,其中,所述翻译质量评估指标是衡量候选译文与标准译文匹配程度的指标;根据所述质量评估分以及所述预设排序规则,对所述多个候选译文进行排序,得到第二排序序列;计算所述第一排序序列与所述第二排序序列之间的误差值,其中,所述误差值反映所述翻译处理的翻译效果;展示所述误差值,以便用户获取所述翻译处理的翻译效果。2.如权利要求1所述的方法,其特征在于,所述原文包括l个词组,所述多个候选译文包括k个候选译文,其中,l为不小于2的正整数,k为正整数;所述对原文进行翻译处理,得到此次翻译处理获取的多个候选译文以及每个所述候选译文对应的准确度评分,包括:根据所述原文以及k个所述已经生成的前i

1个词组,确定多个备选词组以及每个所述备选词组作为第i个词组的概率值,其中,i为大于1且不大于l的正整数;从多个所述概率值中选择出满足预设要求的k个概率值,并得到k个概率值分别对应的第i个词组;将k个所述第i个词组与各自的前i

1个词组组合,得到k个前i个词组;重复执行上述步骤,直到得到k个候选译文;对于k个候选译文中的每个候选译文,根据组成所述候选译文的多个词组的概率值,计算该候选译文对应的准确度评分。3.如权利要求2所述的方法,其特征在于,所述根据所述原文以及k个所述已经生成的前i

1个词组,确定多个备选词组以及每个所述备选词组作为第i个词组的概率值,包括:对于k个已经生成的前i

1个词组中的每个已经生成的前i

1个词组,根据所述原文以及所述已经生成的前i

1个词组,计算词表中a个备选词组的每个词组作为第i个词组的概率值,共得到k*a个概率值,其中,所述词表包括a个备选词组,a为正整数;所述从多个所述概率值中选择出满足预设要求的k个概率值,并得到k个概率值分别对应的第i个词组,包括:从k*a个概率值中选择出满足预设要求的k个概率值,并得到k个概率值分别对应的第i个词组。4.如权利要求3所述的方法,其特征在于,所述从k*a个概率值中选择出满足预设要求的k个概率值,包括:对所述k*a个概率值,按照数值从大到小的顺序进行排序,得到概率值序列;从所述概率值序列截取前k个概率值。5.如权利要求3所述的方法,其特征在于,所述从k*a个概率值中选择出满足预设要求
的k个概率值,包括:计算所述k*a个概率值的平均值;从所述k*a个概率值中随机选择k个大于所述平均值的概率值。6.如权利要求2所述的方法,其特征在于,所述根据组成所述候选译文的多个词组的概率值,计算该候选译文对应的准确度评分,包括:计算组成所述候选译文的多个词组的概率值的乘积,所述乘积为该候选译文对应的准确度评分。7.如权利要求2所述的方法,其特征在于,所述根据组成所述候选译文的多个词组的概率值,计算该候选译文对应的准确度评分,包括:对组成所述候选译文的多个词组中的每个词组的概率值进行对数运算,得到多个对数运算结果;计算所述多个对数运算结果的加和,所述加和为该候选译文对应的准确度评分。8.如权利要求1所述的方法,其特征在于,所述根据翻译质量评估指标对每个所述候选译文进行评估,得到每个所述候选译文对应的质量评估分,包括:对于每个所述候选译文,计算所述候选译文中的连续n个单词组成的词组在所述标准译文中的命中次数,记为目标命中次数,其中,n为正整数;计算所述连续n个单词组成的词组在所述候选译文中的个数,记为目标个数;计算所述目标命中次数与所述目标...

【专利技术属性】
技术研发人员:颜建昊孟凡东
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1