一种机器翻译方法和装置制造方法及图纸

技术编号:30160283 阅读:24 留言:0更新日期:2021-09-25 15:13
本发明专利技术提供了一种机器翻译方法和装置,涉及机器翻译技术领域。本发明专利技术提供的机器翻译方法和装置,首先获取对编码器生成的语义向量进行解码得到的翻译结果,并获取翻译结果的目标评价参数;然后基于翻译结果的目标评价参数,调整当前设置的集束搜索相关参数;最后根据调整后的集束搜索相关参数,更新翻译结果。本发明专利技术的方案能够改善翻译效果较差的句子,保证翻译效果,使翻译的句子更加准确和通顺。使翻译的句子更加准确和通顺。使翻译的句子更加准确和通顺。

【技术实现步骤摘要】
一种机器翻译方法和装置


[0001]本专利技术涉及机器翻译
,特别是涉及一种机器翻译方法和装置。

技术介绍

[0002]机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支,是人工智能的终极目标之一,具有重要的科学研究价值。同时,机器翻译又具有重要的实用价值。随着经济全球化及互联网的飞速发展,机器翻译技术在促进政治、经济、文化交流等方面起到越来越重要的作用。
[0003]目前在采用神经网络进行机器翻译时,为了降低计算的时间和空间复杂度,在解码过程中往往使用集束搜索的方法(Beam Search),即每一步解码时,只保留当前翻译效果最好的几个。这在本质上是一种广度优先搜索(Breadth First Search,BFS)加剪枝的方法,并不能保证得到全局最优的解。最优解或者比当前翻译效果好的次优解可能在剪枝过程中已经被过滤掉。因此采用集束搜索有时翻译效果较差,甚至会遇到同一内容连续重复出现的现象,严重影响机器翻译的使用体验。

技术实现思路

[0004]鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种机器翻译方法和装置。
[0005]依据本专利技术的第一方面,提供了一种机器翻译方法,包括:
[0006]获取对编码器生成的语义向量进行解码得到的翻译结果,并获取所述翻译结果的目标评价参数;
[0007]基于所述翻译结果的目标评价参数,调整当前设置的集束搜索相关参数;
[0008]根据调整后的集束搜索相关参数,更新所述翻译结果。
[0009]可选的,基于所述翻译结果的目标评价参数,调整当前设置的集束搜索相关参数的步骤包括:
[0010]基于所述翻译结果的目标评价参数,以及预先建立的目标评价参数与集束搜索相关参数之间的对应关系,确定目标集束搜索相关参数;
[0011]根据所述目标集束搜索相关参数,调整当前设置的集束搜索相关参数。
[0012]可选的,根据所述目标集束搜索相关参数,调整当前设置的集束搜索相关参数的步骤包括:
[0013]将所述目标集束搜索相关参数与当前设置的集束搜索相关参数进行比较;
[0014]当所述目标集束搜索相关参数大于当前设置的集束搜索相关参数时,扩大当前设置的集束搜索相关参数。
[0015]可选的,获取所述翻译结果的目标评价参数的步骤包括:
[0016]获取以下至少一项:所述翻译结果的句长与所述翻译结果进行去重处理后的句长之间的第一比值、所述翻译结果的句长与待翻译的句子长度之间的第二比值、翻译得分信
息。
[0017]可选的,基于所述翻译结果的目标评价参数,调整当前设置的集束搜索相关参数的步骤包括:
[0018]基于所述第一比值和所述翻译得分信息,调整当前设置的集束搜索相关参数;或者
[0019]基于所述第一比值、所述第二比值和所述翻译得分信息,调整当前设置的集束搜索相关参数。
[0020]可选的,所述集束搜索相关参数包括以下至少一项:集束的宽度、长度惩罚值。
[0021]依据本专利技术的第二方面,提供了一种机器翻译装置,包括:
[0022]获取模块,用于获取对编码器生成的语义向量进行解码得到的翻译结果,并获取所述翻译结果的目标评价参数;
[0023]调整模块,用于基于所述翻译结果的目标评价参数,调整当前设置的集束搜索相关参数;
[0024]更新模块,用于根据调整后的集束搜索相关参数,更新所述翻译结果。
[0025]可选的,所述调整模块包括:
[0026]确定子模块,用于基于所述翻译结果的目标评价参数,以及预先建立的目标评价参数与集束搜索相关参数之间的对应关系,确定目标集束搜索相关参数;
[0027]第一调整子模块,用于根据所述目标集束搜索相关参数,调整当前设置的集束搜索相关参数。
[0028]可选的,所述第一调整子模块包括:
[0029]比较单元,用于将所述目标集束搜索相关参数与当前设置的集束搜索相关参数进行比较;
[0030]调整单元,用于当所述目标集束搜索相关参数大于当前设置的集束搜索相关参数时,扩大当前设置的集束搜索相关参数。
[0031]可选的,所述获取模块包括:
[0032]获取子模块,用于获取以下至少一项:所述翻译结果的句长与所述翻译结果进行去重处理后的句长之间的第一比值、所述翻译结果的句长与待翻译的句子长度之间的第二比值、翻译得分信息。
[0033]可选的,所述调整模块包括:
[0034]第二调整子模块,用于基于所述第一比值和所述翻译得分信息,调整当前设置的集束搜索相关参数;或者
[0035]第三调整子模块,用于基于所述第一比值、所述第二比值和所述翻译得分信息,调整当前设置的集束搜索相关参数。
[0036]可选的,所述集束搜索相关参数包括以下至少一项:集束的宽度、长度惩罚值。
[0037]本专利技术实施例提供的机器翻译方法和装置,获取对编码器生成的语义向量进行解码得到的翻译结果后,不再将一次解码的结果作为最终结果,而是获取所述翻译结果的目标评价参数,目标评价参数能够反映出,按照之前的集束搜索方式得到的翻译结果在某个层面上的翻译效果;然后基于翻译结果的目标评价参数,调整当前设置的集束搜索相关参数,以在翻译效果不理想时及时调整;再根据调整后的集束搜索相关参数,更新翻译结果,
以改善翻译效果较差的句子,保证翻译效果,使翻译的句子更加准确和通顺。
[0038]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。
附图说明
[0039]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0040]图1是本专利技术实施例提供的一种机器翻译方法的步骤流程示意图;
[0041]图2是现有一种翻译模型架构的示意图;
[0042]图3是现有另一种翻译模型架构的示意图;
[0043]图4是本专利技术实施例提供的一种机器翻译装置的示意框图。
具体实施方式
[0044]下面将参照附图更详细地描述本专利技术的示例性实施例。虽然附图中显示了本专利技术的示例性实施例,然而应当理解,可以以各种形式实现本专利技术而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本专利技术,并且能够将本专利技术的范围完整的传达给本领域的技术人员。
[0045]为了更好地理解本专利技术,首先对机器翻译的编码器和解码器进行简要介绍。
[0046]神经机器翻译的模型框架都是编码器Encoder
‑<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种机器翻译方法,其特征在于,包括:获取对编码器生成的语义向量进行解码得到的翻译结果,并获取所述翻译结果的目标评价参数;基于所述翻译结果的目标评价参数,调整当前设置的集束搜索相关参数;根据调整后的集束搜索相关参数,更新所述翻译结果。2.根据权利要求1所述的机器翻译方法,其特征在于,基于所述翻译结果的目标评价参数,调整当前设置的集束搜索相关参数的步骤包括:基于所述翻译结果的目标评价参数,以及预先建立的目标评价参数与集束搜索相关参数之间的对应关系,确定目标集束搜索相关参数;根据所述目标集束搜索相关参数,调整当前设置的集束搜索相关参数。3.根据权利要求2所述的机器翻译方法,其特征在于,根据所述目标集束搜索相关参数,调整当前设置的集束搜索相关参数的步骤包括:将所述目标集束搜索相关参数与当前设置的集束搜索相关参数进行比较;当所述目标集束搜索相关参数大于当前设置的集束搜索相关参数时,扩大当前设置的集束搜索相关参数。4.根据权利要求1

3任一项所述的机器翻译方法,其特征在于,获取所述翻译结果的目标评价参数的步骤包括:获取以下至少一项:所述翻译结果的句长与所述翻译结果进行去重处理后的句长之间的第一比值、所述翻译结果的句长与待翻译的句子长度之间的第二比值、翻译得分信息。5.根据权利要求4所述的机器翻译方法,其特征在于,基于所述翻译结果的目标评价参数,调整当前设置的集束搜索相关参数的步骤包括:基于所述第一比值和所述翻译得分信息,调整当前设置的集束搜索相关参数;或者基于所述第一比值、所述第二比值和所述翻译得分信息,调整当前设置的集束搜索相关参数。6.根据权利要求1

3任一项所述的机器翻译方法,其特征在于,所述集束搜索相关参数包括以下至少一项:集束的宽度、长度惩罚值。7.一...

【专利技术属性】
技术研发人员:刘绍孔李健武卫东陈明
申请(专利权)人:北京捷通华声科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1