译文术语词形自适应替换方法、装置及电子设备制造方法及图纸

技术编号：37957266 阅读：13 留言：0更新日期：2023-06-30 09:30

本发明专利技术提供一种译文术语词形自适应替换方法、装置及电子设备，所述方法包括：对待翻译文本的原始译文文本进行术语替换处理，得到合成译文文本；将所述合成译文文本输入至第一译文术语替换模型中，获取所述第一译文术语替换模型输出的所述待翻译文本对应的目标译文文本；所述第一译文术语替换模型是根据合成译文文本样本和对应的真实译文文本标签训练得到的，所述合成译文文本样本是通过对原始译文文本样本进行术语替换处理得到的。本发明专利技术可以自动生成具有正确术语词形的译文，保证最终译文语法的正确性，在面对含有较多特定领域专业术语的文本翻译场景下可以实现高质量的翻译效果，有效提升了机器翻译译文的质量。有效提升了机器翻译译文的质量。有效提升了机器翻译译文的质量。

全部详细技术资料下载

【技术实现步骤摘要】
译文术语词形自适应替换方法、装置及电子设备

[0001]本专利技术涉及计算机
，尤其涉及一种译文术语词形自适应替换方法、装置及电子设备。

技术介绍

[0002]机器翻译技术是通过计算机等计算设备将一种自然语言的原文翻译为另一种自然语言的译文的技术。由于这一翻译过程由机器完成，所以与人工翻译相比，可以在相对短的时间处理大量的翻译工作。但是，当使用机器翻译技术翻译有较多特定领域专业术语的文本时，由于通用机器翻译系统的训练语料中缺乏特定领域术语的翻译或者领域术语的翻译出现次数较少，导致使用通用的机器翻译方法来翻译此类文本经常会出错，翻译质量差。
[0003]为解决上述问题，在现有技术中，通常会在翻译前对翻译文本中的术语及术语译文进行统一定义，在机器翻译过程中对术语的译文进行自动替换，从而保持术语的翻译在全文中的一致性。然而，这种方法对于术语译文不存在词形变化的情形是适用的，但针对术语译文需要基于当前句子的上下文进行词形变化的情形，会导致术语译文替换后的句子存在语法错误，影响翻译质量。
[0004]因此，在面对含有较多特定领域专业术语的文本翻译场景下，如何更好地进行机器翻译已成为业界亟待解决的技术问题。

技术实现思路

[0005]本专利技术提供一种译文术语词形自适应替换方法、装置及电子设备，用以在面对含有较多特定领域专业术语的文本翻译场景下更好地进行机器翻译，提高翻译质量。
[0006]本专利技术提供一种译文术语词形自适应替换方法，包括：
[0007]对待翻译文本的原始译...

【技术保护点】

【技术特征摘要】
1.一种译文术语词形自适应替换方法，其特征在于，包括：对待翻译文本的原始译文文本进行术语替换处理，得到合成译文文本；将所述合成译文文本输入至第一译文术语替换模型中，获取所述第一译文术语替换模型输出的所述待翻译文本对应的目标译文文本；所述第一译文术语替换模型是根据合成译文文本样本和对应的真实译文文本标签训练得到的，所述合成译文文本样本是通过对原始译文文本样本进行术语替换处理得到的。2.根据权利要求1所述的译文术语词形自适应替换方法，其特征在于，所述对待翻译文本的原始译文文本进行术语替换处理，得到合成译文文本，包括：对待翻译文本的原始译文文本进行分句处理，得到所述原始译文文本对应的多个句子；采用术语提取工具在每个所述句子上进行术语提取，并对每个所述句子提取到的术语进行标记，确定每个所述句子中的术语的标记位置；采用词形还原工具，根据每个所述句子中的术语的标记位置，将每个所述句子中的术语还原为对应的原始术语，得到所述合成译文文本。3.根据权利要求1所述的译文术语词形自适应替换方法，其特征在于，在所述对待翻译文本的原始译文文本进行术语替换处理，得到合成译文文本之后，所述方法还包括：将所述合成译文文本输入至第二译文术语替换模型中，获取所述第二译文术语替换模型输出的所述原始译文文本对应的目标术语；所述第二译文术语替换模型是根据所述合成译文文本样本和对应的术语标签训练得到的；将所述合成译文文本中的原始术语替换为对应的所述目标术语，得到所述待翻译文本对应的所述目标译文文本。4.根据权利要求1所述的译文术语词形自适应替换方法，其特征在于，在将所述合成译文文本输入至第一译文术语替换模型中之前，所述方法还包括：将所述合成译文文本样本和所述合成译文文本样本对应的真实译文文本标签作为一组训练样本，获取多组训练样本；利用所述多组训练样本对T5模型进行训练，得到所述第一译文术语替换模型。5.根据权利要求4所述的译文术语词形自适应替换方法，其特征在于，利用所述多组训练样本对T5模型进行训练，得到所述第一译文术语替换模型，包括：对于任意一组训练样本，将所述训练样本进行分词处理，得到分词...

【专利技术属性】
技术研发人员：毛红保，
申请(专利权)人：传神语联网网络科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人