文本翻译方法、装置、设备和存储介质制造方法及图纸

技术编号：38106863 阅读：14 留言：0更新日期：2023-07-06 09:29

本发明专利技术实施例提供文本翻译方法、装置、设备和存储介质，涉及人工智能技术领域。该方法包括：通过对源语言句子进行编码，得到第一隐藏层向量；然后根据第一隐藏层向量执行迭代翻译过程，在迭代翻译过程中对预测序列的错误进行定位，将错误词语进行掩码后重新预测，直至满足迭代结束条件，将预测序列作为源语言句子的目标语言翻译句子。本申请实施例针对非自回归文本翻译，利用迭代式解码机制提升翻译性能，不同于一次性生成翻译结果的方式，并且其通过迭代翻译过程多次微调中间翻译结果的预测序列，准确判断生成的预测序列中词语的正确性，对其进行错误进行定位，根据定位结果替换需要修改的预测词，能够提升推理速度以及翻译结果。结果。结果。

全部详细技术资料下载

【技术实现步骤摘要】
文本翻译方法、装置、设备和存储介质

[0001]本专利技术涉及人工智能
，尤其涉及文本翻译方法、装置、设备和存储介质。

技术介绍

[0002]机器翻译是利用计算机将一种自然语言（源语言）转换为另一种自然语言（目标语言）的过程。随着技术发展，机器翻译在促进政治、经济、文化交流等方面起到越来越重要的作用。
[0003]相关技术中利用非自回归的神经网络模型进行翻译，非自回归的机器翻译方法假设目标语言翻译结果中词语之间条件独立，从而同时解码生成整个目标语言的翻译结果。但是这种翻译方式基于独立性假设，忽略翻译结果的内在依赖关系，不能准确定位翻译过程中的错误信息，导致非自回归的机器翻译的解码结果会产生较为严重的不一致性，翻译效果较差。

技术实现思路

[0004]本申请实施例的主要目的在于提出文本翻译方法、装置、设备和存储介质，提高文本翻译的准确性。
[0005]为实现上述目的，本申请实施例的第一方面提出了一种文本翻译方法，包括：获取源语言句子，并对所述源语言句子进行编码，得到第一隐藏层向量；根据所述第一隐藏层向量执行迭代翻译过程，所述迭代翻译过程包括：对输入信息进行编码操作，得到第二隐藏层向量，所述输入信息的初始化值为根据所述源语言句子生成的包含文本掩码词的掩码序列；根据掩码位置、所述第一隐藏层向量和所述第二隐藏层向量进行预测，得到预测序列；所述掩码位置的初始化值为所述文本掩码词在所述掩码序列中的位置；根据所述第一隐藏层向量和所述预测序列进行错误定位，得到所述预测序列中每个预测词的定位判断结...

【技术保护点】

【技术特征摘要】
1.一种文本翻译方法，其特征在于，所述方法包括：获取源语言句子，并对所述源语言句子进行编码，得到第一隐藏层向量；根据所述第一隐藏层向量执行迭代翻译过程，所述迭代翻译过程包括：对输入信息进行编码操作，得到第二隐藏层向量，所述输入信息的初始化值为根据所述源语言句子生成的包含文本掩码词的掩码序列；根据掩码位置、所述第一隐藏层向量和所述第二隐藏层向量进行预测，得到预测序列；所述掩码位置的初始化值为所述文本掩码词在所述掩码序列中的位置；根据所述第一隐藏层向量和所述预测序列进行错误定位，得到所述预测序列中每个预测词的定位判断结果，以及当所述定位判断结果为修改时，将所述预测词替换为翻译掩码词；基于所述翻译掩码词、所述预测序列和所述第一隐藏层向量更新所述输入信息，利用所述翻译掩码词在所述预测序列中的位置更新所述掩码位置，重复执行所述迭代翻译过程，直至满足迭代结束条件；将最后一次迭代翻译过程产生的所述预测序列作为所述源语言句子的目标语言翻译句子。2.根据权利要求1所述的文本翻译方法，其特征在于，根据所述源语言句子生成包含文本掩码词的掩码序列，包括：获取所述源语言句子的序列长度；生成与所述序列长度数量相同的所述文本掩码词；基于所述文本掩码词构建所述掩码序列。3.根据权利要求1所述的文本翻译方法，其特征在于，所述方法应用于文本翻译模型，所述文本翻译模型包括错误修改定位模块，所述错误修改定位模块包括错误修改模块，所述错误修改模块包括第一编码器模块；所述对输入信息进行编码操作，得到第二隐藏层向量，包括：将所述输入信息输入所述第一编码器模块进行编码，生成所述第二隐藏层向量。4.根据权利要求3所述的文本翻译方法，其特征在于，所述错误修改模块还包括预测模块，所述预测模块包括第二自注意力层和第一多头注意力层；所述根据掩码位置、所述第一隐藏层向量和所述第二隐藏层向量进行预测，得到预测序列，包括：将所述第二隐藏层向量输入所述第二自注意力层得到第一预测信息；将所述第一预测信息和所述第一隐藏层向量输入所述第一多头注意力层得到第二预测信息；根据所述第二预测信息和所述掩码位置生成每个掩码词的所述预测词，并根据所述预测词生成所述预测序列。5.根据权利要求4所述的文本翻译方法，其特征在于，所述错误修改定位模块还包括错误定位模块；所述错误定位模块包括第二编码器模块和定位分类模块；所述根据所述第一隐藏层向量和所述预测序列进行错误定位，得到所述预测序列中每个预测词的定位判断结果，包括：将所述预测序列和所述第一隐藏层向量输入所述第二编码器模块进行编码，得到第三隐藏层向量；
将所述第三隐藏层向量和所述第一隐藏层向量输入所述定位分类模块进行分类判断，输出每个所述预测词对应的所述定位判...

【专利技术属性】
技术研发人员：冯骁骋，秦兵，耿昕伟，刘挺，聂润泽，相洋，王晖，
申请(专利权)人：鹏城实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人