翻译方法及装置、计算机可读存储介质和电子设备制造方法及图纸

技术编号：32850071 阅读：58 留言：0更新日期：2022-03-30 19:03

本发明专利技术提供了一种翻译方法及装置、计算机可读存储介质和电子设备，涉及数据处理技术领域。该翻译方法包括：获取源语言的待翻译信息对应的文本识别信息，其中，文本识别信息包括混淆网络；将文本识别信息输入翻译模型，以生成待翻译信息对应的目标语言的翻译结果。由于包括混淆网络的文本识别信息能够有效丰富待翻译信息的文本识别结果，因此，本发明专利技术提供的翻译方法能够提高翻译精准度。翻译方法能够提高翻译精准度。翻译方法能够提高翻译精准度。

全部详细技术资料下载

【技术实现步骤摘要】
翻译方法及装置、计算机可读存储介质和电子设备

[0001]本专利技术涉及数据处理
，具体涉及翻译方法及装置、计算机可读存储介质和电子设备。

技术介绍

[0002]近年来，随着全球化的加速发展，越来越多的翻译需求日益涌现。相应地，翻译技术也日益受到关注，尤其是将一个语种(源语言)的语音翻译成另一个语种(目标语言)的文本或者语音的语音翻译技术。
[0003]然而，现有翻译技术的翻译准确度和鲁棒性均较差。即使是基于神经网络的翻译技术，由于受限于训练数据和模型结构的影响，其翻译效果仍然不够理想。

技术实现思路

[0004]为了解决上述技术问题，提出了本专利技术。本专利技术的实施例提供了一种翻译方法及装置、计算机可读存储介质和电子设备。
[0005]第一方面，本专利技术一实施例提供一种翻译方法，该方法包括：获取源语言的待翻译信息对应的文本识别信息，其中，文本识别信息包括混淆网络；将文本识别信息输入翻译模型，以生成待翻译信息对应的目标语言的翻译结果。
[0006]在本专利技术一实施例中，文本识别信息包括多个候选文本识别结果及其各自对应的权重信息，其中，多个候选文本识别结果对应于混淆网络上的多条候选路径。
[0007]在本专利技术一实施例中，多个候选文本识别结果中的每个候选文本识别结果包括多个候选文本识别单元，权重信息包括多个候选文本识别单元各自对应的概率信息。
[0008]在本专利技术一实施例中，翻译模型是经过混淆网络训练得到的。
[0009]在本专利技术一实...

【技术保护点】

【技术特征摘要】
1.一种翻译方法，其特征在于，包括：获取源语言的待翻译信息对应的文本识别信息，其中，所述文本识别信息包括混淆网络；将所述文本识别信息输入翻译模型，以生成所述待翻译信息对应的目标语言的翻译结果。2.根据权利要求1所述的翻译方法，其特征在于，所述文本识别信息包括：多个候选文本识别结果及其各自对应的权重信息，其中，所述多个候选文本识别结果对应于所述混淆网络上的多条候选路径。3.根据权利要求2所述的翻译方法，其特征在于，所述多个候选文本识别结果中的每个候选文本识别结果包括多个候选文本识别单元，所述权重信息包括所述多个候选文本识别单元各自对应的概率信息。4.根据权利要求1所述的翻译方法，其特征在于，所述翻译模型是经过混淆网络训练得到的。5.根据权利要求1至4任一项所述的翻译方法，其特征在于，当所述待翻译信息为待翻译语音信息时，在所述将所述文本识别信息输入翻译模型，以生成所述待翻译信息对应的目标语言的翻译结果之前，还包括：基于所述待翻译语音信息提取声学特征信息；其中，所述将所述文本识别信息输入翻译模型，以生成所述待翻译信息对应的目标语言的翻译结果，包括：将所述文本识别信息和所述声学特征信息输入所述翻译模型，以生成所述待翻译信息对应的目标语言的翻译结果。6.根据权利要...

【专利技术属性】
技术研发人员：卫林钰，张旭，陈伟，
申请(专利权)人：北京搜狗科技发展有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人