一种基于翻译结果智能优化方法、系统及其存储介质技术方案

技术编号：35041218 阅读：12 留言：0更新日期：2022-09-24 23:20

本发明专利技术涉及语言处理模型技术领域，提供一种基于翻译结果智能优化方法、系统及其存储介质。通过根据第一源语言信息以及第二翻译语言信息分别生成第一特征序列以及第二特征序列；将第一特征序列以及第二特征序列输入至BERT模型；确定所述模型倒数第一层的隐状态输出，并执行池化操作，以生成第一特征向量、第二特征向量，将第一、第二特征向量连接后输入至全连接层执行激活操作，获取特征结果；根据特征结果与第一代价函数优化翻译模型。通过对翻译模型的调整确保翻译模型翻译精准，解决翻译模型优化以及参数调整的效率较低，且依赖于原始样本易陷入局部最优环境的技术问题。样本易陷入局部最优环境的技术问题。样本易陷入局部最优环境的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于翻译结果智能优化方法、系统及其存储介质

[0001]本专利技术涉及语言信息处理模型
，具体而言，涉及一种基于翻译结果智能优化方法、系统及其存储介质。

技术介绍

[0002]一般翻译软件通过机器学习方法实现对不同语言之间的转换，近年来取得了巨大的进步，尤其随着深度学习的出现与发展，神经网络的翻译模型因其译文质量较高的优点逐步占据主流地位。
[0003]现有技术的语言处理虽然在强大的神经网络框架下得到的词向量在模型内部已经得到充分的交互，但是针对译文质量评估这样的跨语言任务，应该加入更多体现翻译特性的特征进行评估，无论在细粒度的互为翻译对的词向量之间，还是粗粒度的源语言和目标翻译的句向量之间，都可以挖掘更具体的翻译特征；但是现有技术对于语言的处理，包括翻译方面的模型的优化以及参数特征的调整效率较低，且模型的优化依赖于原始样本容易陷入局部的最优的环境。

技术实现思路

[0004]有鉴于此，本专利技术实施例的目的在于提供模型优化，对大数据库内的语言信息执行的语句翻译模型的调整以使得翻译模型的翻译精准。
[0005]本专利技术的第一方面提供了一种基于翻译结果智能优化方法，所述方法包括：S1，根据待翻译的源语言大数据信息库，获取第一源语言信息，并基于神经网络翻译模型生成第二翻译语言信息；根据所述第一源语言信息以及第二翻译语言信息分别生成第一特征序列以及第二特征序列；S2，将所述第一特征序列以及第二特征序列输入至BERT模型；确定所述BERT模型的倒数第一层的隐状态输出，并执行池化操作...

【技术保护点】

【技术特征摘要】
1.一种基于翻译结果智能优化方法，其特征在于，所述方法包括：S1，根据待翻译的源语言大数据信息库，获取第一源语言信息，并基于神经网络翻译模型生成第二翻译语言信息；根据所述第一源语言信息以及第二翻译语言信息分别生成第一特征序列以及第二特征序列；S2，将所述第一特征序列以及第二特征序列输入至BERT模型；确定所述BERT模型的倒数第一层的隐状态输出，并执行池化操作，以生成第一特征向量以及第二特征向量；S3，将所述第一特征向量以及第二特征向量进行连接并输入至全连接层执行激活操作，以获取特征结果；S4，根据所述特征结果以及第一代价函数，调整神经网络翻译模型以更新第二翻译语言信息，以使得所述第一代价函数对应的代价小于预定阈值；S5，确定所述第一代价函数对应的代价小于预定阈值时对应的第二翻译语言信息作为最终的第二翻译语言信息；保存调整后的所述神经网络翻译模型参数。2.根据权利要求1所述的基于翻译结果智能优化方法，其特征在于，所述S1，根据待翻译的源语言大数据信息库，获取第一源语言信息，并基于神经网络翻译模型生成第二翻译语言信息，包括：根据翻译优先级，从待翻译的源语言大数据信息库中提取第一源语言信息；根据神经网络翻译模型对所述第一源语言信息执行翻译操作，以获取第二翻译语言信息；所述神经网络翻译模型是基于双向RNN结构的翻译模型。3.根据权利要求2所述的基于翻译结果智能优化方法，其特征在于，所述池化操作为平均池化操作；所述S2，将所述第一特征序列以及第二特征序列输入至BERT模型；确定所述BERT模型的倒数第一层的隐状态输出，并执行池化操作，以生成第一特征向量以及第二特征向量，包括：括：其中，所述u、v分别表示第一特征向量、第二特征向量；src表示第一特征序列；tgt表示第二特征序列；n、n
’
分别表示所述第一特征序列、第二特征序列的长度；h
D
表示所述BERT模型的倒数第一层的隐状态输出值。4.根据权利要求3所述的基于翻译结果智能优化方法，其特征在于，所述S3，所述第一特征向量以及第二特征向量进行连接并输入至全连接层执行激活操作，以获取特征结果，包括：根据sigmoid函数执行所述激活操作；将对第一特征向量u以及第二特征向量v的连接操作后执行的全连接层特征结果，作为所述sigmoid函数的输入。5.根据权利要求4所述的基于翻译结果智能优化方法，其特征在于，所述S4，根据所述特征结果以及第一代价函数，调整神经网络翻译模型以更新第二翻译语言信息，以使得所
述第一代价函数对应的代价小于预定阈值，包括：S41，将均方差函数作为第一代价函数，计算所述特征结果与标准特征参数之间的均方差，若所述均方差大于预定阈值，则调整所述神经网络翻译模型的参数，更新第二翻译语言信息；S42，基于第一源语言信息、更新后的第二翻译语言信息执行步骤S1
‑
S4，以使得均方差小于预定阈值。6.根据权利要求5所述的基于翻译结果智能优化方...

【专利技术属性】
技术研发人员：葛玉梅，郑春光，贾磊，杨玉猛，梅康，颜妍，江心波，
申请(专利权)人：山东智慧译百信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人