一种口语的翻译方法、装置及存储介质制造方法及图纸

技术编号:36707488 阅读:10 留言:0更新日期:2023-03-01 09:31
本发明专利技术公开一种口语的翻译方法、装置及存储介质,属于自然语言处理技术领域。该口语的翻译方法,包括以下步骤:S1、将正确文本数据和噪声文本数据同时输入翻译模型,计算对比损失;S2、根据所述对比损失和翻译任务损失计算模型的损失,训练模型。该口语的翻译装置,包括:计算单元,用于将正确文本数据和噪声文本数据同时输入翻译模型,计算对比损失;训练单元,所述训练单元用于根据对比损失和翻译任务损失计算模型的损失,训练模型。该方法不需要增加计算和存储开销降低了识别错误对文本表示的影响,进而提升翻译模型的鲁棒性。进而提升翻译模型的鲁棒性。进而提升翻译模型的鲁棒性。

【技术实现步骤摘要】
一种口语的翻译方法、装置及存储介质


[0001]本专利技术涉及自然语言处理
,具体涉及一种口语的翻译方法、装置及存储介质。

技术介绍

[0002]尽管基于深度神经网络的神经机器翻译取得了突破性地发展,被广泛地应用于实际生产中,但神经机器翻译系统极易受到输入噪声的干扰而产生错误的翻译,特别是在口语翻译场景中。这是因为在口语翻译场景,翻译系统的输入来自语音识别的输出,而即使是高性能的商用语音识别引擎别也难以避免地存在多字、少字、同音字替换等识别错误,这些错误导致神经机器翻译的性能大幅下降。
[0003]现有方法多采用在语音识别结果输入翻译系统之前进行错误校正的级联式策略,即首先对语音识别结果进行错误检测和修正,然后将修正后的口语文本输入翻译系统得到最终的译文。另外一些方法则通过噪声增强的方式,在训练数据中加入合成噪声,进而训练对识别错误鲁棒的神经机器翻译模型,以减少识别错误在系统应用时对翻译模型的影响。
[0004]上述级联式方法通常需要先训练一个复杂的错误检测和校正模型,极大地增加了系统部署时的计算资源开销,并且在检测和校正阶段可能引入其他额外的错误。第二类噪声增强的方法仅能合成同音词错误,对于翻译性能的提升有限,如何在不增加计算和存储开销的情况下,提升翻译模型的鲁棒性是现有技术的难题。

技术实现思路

[0005]本专利技术的目的在于克服上述技术不足,提供一种口语的翻译方法、装置及存储介质,解决现有技术中如何在不增加计算和存储开销的情况下,提升翻译模型的鲁棒性的技术问题。
[0006]为达到上述技术目的,本专利技术的技术方案提供一种口语的翻译方法,包括以下步骤:
[0007]S1、将正确文本数据和噪声文本数据同时输入翻译模型,计算对比损失;
[0008]S2、根据所述对比损失和翻译任务损失计算模型的损失,训练模型。
[0009]进一步地,在步骤S1中,所述噪音本文数据是通过对所述正确文本数据进行预处理得到;所述预处理包括:将所述正确文本数据中的字替换为同音字或近音字、将所述正确文本数据中的字进行随机删除、在所述正确文本数据中根据语言模型概率产生多余字符进行随机插入。
[0010]进一步地,在步骤S1中,所述对比损失由以下步骤得到:通过正确文本数据和噪声文本数据经过编码器处理后得到语义表示,之后将所述语义表示经过非线性映射和池化投影到对比学习空间,得到对比学习表示,之后通过句子级别或词级别的对比损失学习对正例和负例的区分得到所述对比损失;所述对比损失包括句子级别对比损失和词级别对比损失。
[0011]进一步地,在步骤S1中,所述句子级别对比损失由以下步骤得到:
[0012]所述对于输入至翻译模型中的一对正确文本和噪声文本,首先经过编码器编码得到语义表示与然后经过非线性映射投影到对比空间,将对比空间中的词表示序列进行平均池化得到句表示s
x
与S
z
,句表示计算公式为:
[0013][0014]其中,W
a
、W
b
、b为神经网络的参数,ReLU为非线性激活函数;使用S
x
与s
z
作为一组正例,s
x
或S
z
与同一训练批次内的其他正确文本和噪声文本的句表示作为负例,通过对比学习使x与Z的句表示在对比空间中足够相似,同时与其他所有负例的句表示距离较远,所述句子级别对比损失为:
[0015][0016]其中,sim(
·
)为余弦相似度函数,{S}为当前训练批次内所有句表示的集合,表示当前训练批次内除去以外的句表示集合;D表示正确文本数据集。
[0017]进一步地,在步骤S1中,所述词级别对比损失由以下步骤得到:
[0018]获得噪声文本z与正确文本x之间的非对齐子串;
[0019]将所述非对齐子串对应的编码表示与经过非线性映射投影到对比空间,将对比空间中的非对齐子串表示序列进行平均池化得到非对齐子串的表示与非对齐子串表示的计算公式为:
[0020][0021]则与构成一组正例,或与同一训练批次内的其他所有非对齐子串的表示向量构成负例,使用对比学习拉近噪声词与正确词的编码表示之间的距离,从而减少语音识别错误处词表示的偏移,则词级别对比损失为:
[0022]其中,D表示正确文本数据集。
[0023]进一步地,在步骤S2中,所述翻译任务损失由以下步骤得到:在翻译模块中,解码器获取到所述正确文本数据和所述噪声文本数据的语义文本,然后将所述语义文本分别解
码得到翻译结果,计算二者的翻译结果与参考译文的机器翻译损失得到所述翻译任务损失。
[0024]进一步地,在步骤S2中,所述翻译任务损失由以下步骤得到:根据在正确文本数据集和包含识别错误的噪声文本数据集得到所述翻译任务损失为:
[0025][0026]进一步地,在步骤S2中,所述模型的损失为:
[0027][0028],其中λ1和λ2为调节对比损失重要程度的超参数,表示翻译任务损失,表示句子级别对比损失,表示词级别对比损失。
[0029]此外,本专利技术还提出一种口语的翻译装置,包括:
[0030]计算单元,用于将正确文本数据和噪声文本数据同时输入翻译模型,计算对比损失;
[0031]训练单元,所述训练单元用于根据对比损失和翻译任务损失计算模型的损失,训练模型。
[0032]进一步地,本专利技术还提出一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述口语的翻译方法的步骤。
[0033]与现有技术相比,本专利技术的有益效果包括:本专利技术提出的口语翻译方法,针对口语翻译系统中语音识别错误的问题,采用了对比学习方法,将正确文本数据和噪声文本数据同时输入翻译模型,计算对比损失,根据对比损失和翻译任务损失联用计算模型的损失,训练模型,不需要增加计算和存储开销降低了识别错误对文本表示的影响,进而提升翻译模型的鲁棒性。
附图说明
[0034]图1是本专利技术具体实施方式的口语的翻译方法的流程图;
[0035]图2是本专利技术具体实施方式的口语的翻译装置的结构框图。
[0036]图3是本专利技术实施例1中句子级别对比损失和次级别对比损失的示意图。
具体实施方式
[0037]结合图1,本具体实施方式提供了一种口语的翻译方法,包括以下步骤:
[0038]S1、将正确文本数据和噪声文本数据同时输入翻译模型,计算对比损失;所述噪音数据是通过对所述正确文本数据进行预处理得到;所述预处理包括:将所述正确文本数据中的字替换为同音字或近音字、将所述正确文本数据中的字进行随机删除、在所述正确文本数据中根据语言模型概率产生多余字符进行随机插入;
[0039]进一步地,所述对比损失由以下步骤得到:通过正确文本数据和噪声文本数据经过编码器处理后得到语义表示,之后将所述语义表示经过非线性映射和池化投影到对比学
习空间,得到对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种口语的翻译方法,其特征在于,包括以下步骤:S1、将正确文本数据和噪声文本数据同时输入翻译模型,计算对比损失;S2、根据所述对比损失和翻译任务损失计算模型的损失,训练模型。2.根据权利要求1所述的口语的翻译方法,其特征在于,在步骤S1中,所述噪音本文数据是通过对所述正确文本数据进行预处理得到;所述预处理包括:将所述正确文本数据中的字替换为同音字或近音字、将所述正确文本数据中的字进行随机删除、在所述正确文本数据中根据语言模型概率产生多余字符进行随机插入。3.根据权利要求1所述的口语的翻译方法,其特征在于,在步骤S1中,所述对比损失由以下步骤得到:通过正确文本数据和噪声文本数据经过编码器处理后得到语义表示,之后将所述语义表示经过非线性映射和池化投影到对比学习空间,得到对比学习表示,之后通过句子级别或词级别的对比损失学习对正例和负例的区分得到所述对比损失;所述对比损失包括句子级别对比损失和词级别对比损失。4.根据权利要求3所述的口语的翻译方法,其特征在于,在步骤S1中,所述句子级别对比损失由以下步骤得到:所述对于输入至翻译模型中的一对正确文本和噪声文本,首先经过编码器编码得到语义表示与然后经过非线性映射投影到对比空间,将对比空间中的词表示序列进行平均池化得到句表示s
x
与s
z
,句表示计算公式为:其中,W
a
、W
b
、b为神经网络的参数,ReLU为非线性激活函数;使用s
x
与s
z
作为一组正例,s
x
或s
z
与同一训练批次内的其他正确文本和噪声文本的句表示作为负例,通过对比学习使x与Z的句表示在对比空间中足够相似,同时与其他所有负例的句表示距离较远,所述句子级别对比损失为:其中,sim(
·

【专利技术属性】
技术研发人员:邓彪刘宇宸
申请(专利权)人:中科凡语武汉科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1