一种口语的翻译方法、装置及存储介质制造方法及图纸

技术编号：36707488 阅读：10 留言：0更新日期：2023-03-01 09:31

本发明专利技术公开一种口语的翻译方法、装置及存储介质，属于自然语言处理技术领域。该口语的翻译方法，包括以下步骤：S1、将正确文本数据和噪声文本数据同时输入翻译模型，计算对比损失；S2、根据所述对比损失和翻译任务损失计算模型的损失，训练模型。该口语的翻译装置，包括：计算单元，用于将正确文本数据和噪声文本数据同时输入翻译模型，计算对比损失；训练单元，所述训练单元用于根据对比损失和翻译任务损失计算模型的损失，训练模型。该方法不需要增加计算和存储开销降低了识别错误对文本表示的影响，进而提升翻译模型的鲁棒性。进而提升翻译模型的鲁棒性。进而提升翻译模型的鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
一种口语的翻译方法、装置及存储介质

[0001]本专利技术涉及自然语言处理
，具体涉及一种口语的翻译方法、装置及存储介质。

技术介绍

[0002]尽管基于深度神经网络的神经机器翻译取得了突破性地发展，被广泛地应用于实际生产中，但神经机器翻译系统极易受到输入噪声的干扰而产生错误的翻译，特别是在口语翻译场景中。这是因为在口语翻译场景，翻译系统的输入来自语音识别的输出，而即使是高性能的商用语音识别引擎别也难以避免地存在多字、少字、同音字替换等识别错误，这些错误导致神经机器翻译的性能大幅下降。
[0003]现有方法多采用在语音识别结果输入翻译系统之前进行错误校正的级联式策略，即首先对语音识别结果进行错误检测和修正，然后将修正后的口语文本输入翻译系统得到最终的译文。另外一些方法则通过噪声增强的方式，在训练数据中加入合成噪声，进而训练对识别错误鲁棒的神经机器翻译模型，以减少识别错误在系统应用时对翻译模型的影响。
[0004]上述级联式方法通常需要先训练一个复杂的错误检测和校正模型，极大地增加了系统部署时的计算资源开销，并且在检测和校正阶段可能引入其他额外的错误。第二类噪声增强的方法仅能合成同音词错误，对于翻译性能的提升有限，如何在不增加计算和存储开销的情况下，提升翻译模型的鲁棒性是现有技术的难题。

技术实现思路

[0005]本专利技术的目的在于克服上述技术不足，提供一种口语的翻译方法、装置及存储介质，解决现有技术中如何在不增加计算和存储开销的情况下，提升翻译模型的鲁棒性的技术问题。
...

【技术保护点】

【技术特征摘要】
1.一种口语的翻译方法，其特征在于，包括以下步骤：S1、将正确文本数据和噪声文本数据同时输入翻译模型，计算对比损失；S2、根据所述对比损失和翻译任务损失计算模型的损失，训练模型。2.根据权利要求1所述的口语的翻译方法，其特征在于，在步骤S1中，所述噪音本文数据是通过对所述正确文本数据进行预处理得到；所述预处理包括：将所述正确文本数据中的字替换为同音字或近音字、将所述正确文本数据中的字进行随机删除、在所述正确文本数据中根据语言模型概率产生多余字符进行随机插入。3.根据权利要求1所述的口语的翻译方法，其特征在于，在步骤S1中，所述对比损失由以下步骤得到：通过正确文本数据和噪声文本数据经过编码器处理后得到语义表示，之后将所述语义表示经过非线性映射和池化投影到对比学习空间，得到对比学习表示，之后通过句子级别或词级别的对比损失学习对正例和负例的区分得到所述对比损失；所述对比损失包括句子级别对比损失和词级别对比损失。4.根据权利要求3所述的口语的翻译方法，其特征在于，在步骤S1中，所述句子级别对比损失由以下步骤得到：所述对于输入至翻译模型中的一对正确文本和噪声文本，首先经过编码器编码得到语义表示与然后经过非线性映射投影到对比空间，将对比空间中的词表示序列进行平均池化得到句表示s
x
与s
z
，句表示计算公式为：其中，W
a
、W
b
、b为神经网络的参数，ReLU为非线性激活函数；使用s
x
与s
z
作为一组正例，s
x
或s
z
与同一训练批次内的其他正确文本和噪声文本的句表示作为负例，通过对比学习使x与Z的句表示在对比空间中足够相似，同时与其他所有负例的句表示距离较远，所述句子级别对比损失为：其中，sim(
·

【专利技术属性】
技术研发人员：邓彪，刘宇宸，
申请(专利权)人：中科凡语武汉科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人