一种基于翻译结果智能优化方法、系统及其存储介质技术方案

技术编号:35041218 阅读:12 留言:0更新日期:2022-09-24 23:20
本发明专利技术涉及语言处理模型技术领域,提供一种基于翻译结果智能优化方法、系统及其存储介质。通过根据第一源语言信息以及第二翻译语言信息分别生成第一特征序列以及第二特征序列;将第一特征序列以及第二特征序列输入至BERT模型;确定所述模型倒数第一层的隐状态输出,并执行池化操作,以生成第一特征向量、第二特征向量,将第一、第二特征向量连接后输入至全连接层执行激活操作,获取特征结果;根据特征结果与第一代价函数优化翻译模型。通过对翻译模型的调整确保翻译模型翻译精准,解决翻译模型优化以及参数调整的效率较低,且依赖于原始样本易陷入局部最优环境的技术问题。样本易陷入局部最优环境的技术问题。样本易陷入局部最优环境的技术问题。

【技术实现步骤摘要】
一种基于翻译结果智能优化方法、系统及其存储介质


[0001]本专利技术涉及语言信息处理模型
,具体而言,涉及一种基于翻译结果智能优化方法、系统及其存储介质。

技术介绍

[0002]一般翻译软件通过机器学习方法实现对不同语言之间的转换,近年来取得了巨大的进步,尤其随着深度学习的出现与发展,神经网络的翻译模型因其译文质量较高的优点逐步占据主流地位。
[0003]现有技术的语言处理虽然在强大的神经网络框架下得到的词向量在模型内部已经得到充分的交互,但是针对译文质量评估这样的跨语言任务,应该加入更多体现翻译特性的特征进行评估,无论在细粒度的互为翻译对的词向量之间,还是粗粒度的源语言和目标翻译的句向量之间,都可以挖掘更具体的翻译特征;但是现有技术对于语言的处理,包括翻译方面的模型的优化以及参数特征的调整效率较低,且模型的优化依赖于原始样本容易陷入局部的最优的环境。

技术实现思路

[0004]有鉴于此,本专利技术实施例的目的在于提供模型优化,对大数据库内的语言信息执行的语句翻译模型的调整以使得翻译模型的翻译精准。
[0005]本专利技术的第一方面提供了一种基于翻译结果智能优化方法,所述方法包括:S1,根据待翻译的源语言大数据信息库,获取第一源语言信息,并基于神经网络翻译模型生成第二翻译语言信息;根据所述第一源语言信息以及第二翻译语言信息分别生成第一特征序列以及第二特征序列;S2,将所述第一特征序列以及第二特征序列输入至BERT模型;确定所述BERT模型的倒数第一层的隐状态输出,并执行池化操作,以生成第一特征向量以及第二特征向量;S3,将所述第一特征向量以及第二特征向量进行连接并输入至全连接层执行激活操作,以获取特征结果;S4,根据所述特征结果以及第一代价函数,调整神经网络翻译模型以更新第二翻译语言信息,以使得所述第一代价函数对应的代价小于预定阈值;S5,确定所述第一代价函数对应的代价小于预定阈值时对应的第二翻译语言信息作为最终的第二翻译语言信息;保存调整后的所述神经网络翻译模型参数。
[0006]进一步,所述S1,根据待翻译的源语言大数据信息库,获取第一源语言信息,并基于神经网络翻译模型生成第二翻译语言信息,包括:根据翻译优先级,从待翻译的源语言大数据信息库中提取第一源语言信息;根据神经网络翻译模型对所述第一源语言信息执行翻译操作,以获取第二翻译语言信息;所述神经网络翻译模型是基于双向RNN结构的翻译模型。
[0007]进一步,所述池化操作为平均池化操作;所述S2,将所述第一特征序列以及第二特征序列输入至BERT模型;确定所述BERT模型的倒数第一层的隐状态输出,并执行池化操作,以生成第一特征向量以及第二特征向量,包括:包括:其中,所述u、v分别表示第一特征向量、第二特征向量;src表示第一特征序列;tgt表示第二特征序列;n、n

分别表示所述第一特征序列、第二特征序列的长度;h
D
表示所述BERT模型的倒数第一层的隐状态输出值。
[0008]进一步,所述S3,将所述第一特征向量以及第二特征向量进行连接并输入至全连接层执行激活操作,以获取特征结果,包括:根据sigmoid函数执行所述激活操作;将对第一特征向量u以及第二特征向量v的连接操作后执行的全连接层特征结果,作为所述sigmoid函数的输入。
[0009]进一步,所述S4,根据所述特征结果以及第一代价函数,调整神经网络翻译模型以更新第二翻译语言信息,以使得所述第一代价函数对应的代价小于预定阈值,包括:S41,将均方差函数作为第一代价函数,计算所述特征结果与标准特征参数之间的均方差,若所述均方差大于预定阈值,则调整所述神经网络翻译模型的参数,更新第二翻译语言信息;S42,基于第一源语言信息、更新后的第二翻译语言信息执行步骤S1

S4,以使得均方差小于预定阈值。
[0010]进一步,预先从待翻译的源语言大数据信息库中确定若干候选源语言信息,并执行对应生成翻译专家对所述若干候选源语言信息执行翻译;将所述候选源语言信息确定为第一源语言信息的候选库;所述标准特征参数根据如下方式获取:S401,事先获取第一源语言信息及其对应的根据翻译专家对所述第一源语言信息执行翻译后的专家翻译语言信息,并生成第三特征序列;S402,将所述第一特征序列、第三特征序列输入至BERT模型;确定所述BERT模型的倒数第一层的隐状态输出,并执行平均池化操作,以生成第一特征向量以及第三特征向量;S403,将所述第一特征向量以及第三特征向量进行连接并输入至全连接层以执行基于sigmoid函数的激活操作,从而获取标准特征参数。
[0011]此外,还提出一种基于翻译结果智能优化系统,所述系统包括:第一获取与生成模块,根据待翻译的源语言大数据信息库,获取第一源语言信息,并基于神经网络翻译模型生成第二翻译语言信息;根据所述第一源语言信息以及第二翻译语言信息分别生成第一特征序列以及第二特征序列;第二处理与生成模块,将所述第一特征序列以及第二特征序列输入至BERT模型;确定所述BERT模型的倒数第一层的隐状态输出,并执行池化操作,以生成第一特征向量以及第二特征向量;
第三获取模块,将所述第一特征向量以及第二特征向量进行连接并输入至全连接层执行激活操作,以获取特征结果;调整模块,根据所述特征结果以及第一代价函数,调整神经网络翻译模型以更新第二翻译语言信息,以使得所述第一代价函数对应的代价小于预定阈值;确定模块,确定所述第一代价函数对应的代价小于预定阈值时对应的第二翻译语言信息作为最终的第二翻译语言信息;保存调整后的所述神经网络翻译模型参数。
[0012]进一步,所述根据待翻译的源语言大数据信息库,获取第一源语言信息,并基于神经网络翻译模型生成第二翻译语言信息,包括:根据翻译优先级,从待翻译的源语言大数据信息库中提取第一源语言信息;根据神经网络翻译模型对所述第一源语言信息执行翻译操作,以获取第二翻译语言信息;所述神经网络翻译模型是基于双向RNN结构的翻译模型。
[0013]进一步,所述池化操作为平均池化操作;所述将所述第一特征序列以及第二特征序列输入至BERT模型;确定所述BERT模型的倒数第一层的隐状态输出,并执行池化操作,以生成第一特征向量以及第二特征向量,包括:括:其中,所述u、v分别表示第一特征向量、第二特征向量;src表示第一特征序列;tgt表示第二特征序列;n、n

分别表示所述第一特征序列、第二特征序列的长度;h
D
表示所述BERT模型的倒数第一层的隐状态输出值。
[0014]此外,还提出一种存储介质,所述存储介质存储有计算机程序;所述程序由处理器加载并执行以实现如上所述的基于翻译结果智能优化方法步骤。
[0015]本专利技术的方案中,通过根据待翻译的源语言大数据信息库,获取第一源语言信息,并基于神经网络翻译模型生成第二翻译语言信息;根据所述第一源语言信息以及第二翻译语言信息分别生成第一特征序列以及第二特征序列;将所述第一特征序列以及第二特征序列输本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于翻译结果智能优化方法,其特征在于,所述方法包括:S1,根据待翻译的源语言大数据信息库,获取第一源语言信息,并基于神经网络翻译模型生成第二翻译语言信息;根据所述第一源语言信息以及第二翻译语言信息分别生成第一特征序列以及第二特征序列;S2,将所述第一特征序列以及第二特征序列输入至BERT模型;确定所述BERT模型的倒数第一层的隐状态输出,并执行池化操作,以生成第一特征向量以及第二特征向量;S3,将所述第一特征向量以及第二特征向量进行连接并输入至全连接层执行激活操作,以获取特征结果;S4,根据所述特征结果以及第一代价函数,调整神经网络翻译模型以更新第二翻译语言信息,以使得所述第一代价函数对应的代价小于预定阈值;S5,确定所述第一代价函数对应的代价小于预定阈值时对应的第二翻译语言信息作为最终的第二翻译语言信息;保存调整后的所述神经网络翻译模型参数。2.根据权利要求1所述的基于翻译结果智能优化方法,其特征在于,所述S1,根据待翻译的源语言大数据信息库,获取第一源语言信息,并基于神经网络翻译模型生成第二翻译语言信息,包括:根据翻译优先级,从待翻译的源语言大数据信息库中提取第一源语言信息;根据神经网络翻译模型对所述第一源语言信息执行翻译操作,以获取第二翻译语言信息;所述神经网络翻译模型是基于双向RNN结构的翻译模型。3.根据权利要求2所述的基于翻译结果智能优化方法,其特征在于,所述池化操作为平均池化操作;所述S2,将所述第一特征序列以及第二特征序列输入至BERT模型;确定所述BERT模型的倒数第一层的隐状态输出,并执行池化操作,以生成第一特征向量以及第二特征向量,包括:括:其中,所述u、v分别表示第一特征向量、第二特征向量;src表示第一特征序列;tgt表示第二特征序列;n、n

分别表示所述第一特征序列、第二特征序列的长度;h
D
表示所述BERT模型的倒数第一层的隐状态输出值。4.根据权利要求3所述的基于翻译结果智能优化方法,其特征在于,所述S3,所述第一特征向量以及第二特征向量进行连接并输入至全连接层执行激活操作,以获取特征结果,包括:根据sigmoid函数执行所述激活操作;将对第一特征向量u以及第二特征向量v的连接操作后执行的全连接层特征结果,作为所述sigmoid函数的输入。5.根据权利要求4所述的基于翻译结果智能优化方法,其特征在于,所述S4,根据所述特征结果以及第一代价函数,调整神经网络翻译模型以更新第二翻译语言信息,以使得所
述第一代价函数对应的代价小于预定阈值,包括:S41,将均方差函数作为第一代价函数,计算所述特征结果与标准特征参数之间的均方差,若所述均方差大于预定阈值,则调整所述神经网络翻译模型的参数,更新第二翻译语言信息;S42,基于第一源语言信息、更新后的第二翻译语言信息执行步骤S1

S4,以使得均方差小于预定阈值。6.根据权利要求5所述的基于翻译结果智能优化方...

【专利技术属性】
技术研发人员:葛玉梅郑春光贾磊杨玉猛梅康颜妍江心波
申请(专利权)人:山东智慧译百信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1