翻译机器输入降噪方法技术

技术编号:39507227 阅读:7 留言:0更新日期:2023-11-25 18:42
本发明专利技术提供一种翻译机器输入降噪方法

【技术实现步骤摘要】
翻译机器输入降噪方法、装置和电子设备


[0001]本专利技术涉及计算机
,尤其涉及一种翻译机器输入降噪方法

装置和电子设备


技术介绍

[0002]随着科技的发展,机器翻译技术取得了巨大的进步,机器翻译技术的关键是提高翻译质量和效率

相关技术中,采用带有翻译记忆
(Translation Memory

TM)
功能的翻译机器进行翻译,具体是针对一个待翻译的句子,翻译机器的机器翻译系统从
TM
库中检索与其相似的句子

若找到完全匹配的句子,则将其目标译文作为答案返回;若未找到,则将最相似的几个句子译文作为
TM
参考,对机器翻译的结果进行干涉,将待翻译的句子和由翻译记忆干涉后的译文输入至机器翻译系统

然而,使用
TM
对翻译过程进行干涉可能对翻译结果产生负面影响,导致翻译准确率较低


技术实现思路

[0003]本专利技术提供一种翻译机器输入降噪方法

装置和电子设备,用以解决相关技术中采用带
TM
的翻译机器进行翻译时,存在翻译记忆对翻译结果产生负面影响,导致翻译准确率较低等缺陷

[0004]第一方面,本专利技术提供一种翻译机器输入降噪方法,包括:
[0005]获取待翻译原文对应的翻译记忆译文;
[0006]对所述待翻译原文和所述翻译记忆译文进行预处理,得到所述待翻译原文的词向量和所述翻译记忆译文的词向量;
[0007]对所述翻译记忆译文的词向量进行降噪处理,得到降噪后的词向量,所述降噪处理用于降低词性和
/
或词义对目标译文的影响;
[0008]将所述待翻译原文的词向量和所述降噪后的词向量输入至翻译机器,输出所述目标译文;
[0009]其中,所述翻译机器为带翻译记忆功能的翻译机器

[0010]在一些实施例中,所述对所述待翻译原文和所述翻译记忆译文进行预处理,得到所述待翻译原文的词向量和所述翻译记忆译文的词向量,包括:
[0011]分别对所述待翻译原文和所述翻译记忆译文进行分词

词性标注

词嵌入,得到所述待翻译原文的词向量和所述翻译记忆译文的词向量

[0012]在一些实施例中,所述对所述翻译记忆译文的词向量进行降噪处理,得到降噪后的词向量,包括:
[0013]对被标注为实词的所述翻译记忆译文的词向量进行实词惩罚,得到降噪后的词向量,所述实词惩罚用于降低词性对目标译文的影响

[0014]在一些实施例中,所述对所述翻译记忆译文的词向量进行降噪处理,得到降噪后的词向量,包括:
[0015]对所述待翻译原文的词向量和所述翻译记忆译文的词向量进行相似度计算,得到第一相似度矩阵;
[0016]基于所述第一相似度矩阵,对所述翻译记忆译文的词向量实施无对应惩罚,得到降噪后的词向量,所述无对应惩罚用于降低词义对目标译文的影响

[0017]在一些实施例中,所述对所述翻译记忆译文的词向量进行降噪处理,得到降噪后的词向量,包括:
[0018]对被标注为实词的所述翻译记忆译文的词向量进行实词惩罚,得到降噪后的第一词向量,所述实词惩罚用于降低词性对目标译文的影响;
[0019]对所述待翻译原文的词向量和所述降噪后的第一词向量进行相似度计算,得到第二相似度矩阵;
[0020]基于所述第二相似度矩阵,对所述降噪后的第一词向量进行无对应惩罚,得到降噪后的词向量,所述无对应惩罚用于降低词义对目标译文的影响

[0021]在一些实施例中,所述对所述翻译记忆译文的词向量进行降噪处理,得到降噪后的词向量,包括:
[0022]对所述待翻译原文的词向量和所述翻译记忆译文的词向量进行相似度计算,得到第一相似度矩阵;
[0023]基于所述第一相似度矩阵,对所述翻译记忆译文的词向量实施无对应惩罚,得到降噪后的第二词向量,所述无对应惩罚用于降低词义对目标译文的影响;
[0024]对被标注为实词的所述降噪后的第二词向量进行实词惩罚,得到降噪后的词向量,所述实词惩罚用于降低词性对目标译文的影响

[0025]在一些实施例中,所述对被标注为实词的所述翻译记忆译文的词向量进行实词惩罚,得到降噪后的词向量,包括:
[0026]获取实词惩罚阈值;
[0027]将所述被标注为实词的所述翻译记忆译文的词向量与所述实词惩罚阈值相乘,得到降噪后的实词词向量,将所述降噪后的实词词向量和所述翻译记忆译文的词向量中未实施实词惩罚的词向量作为降噪后的词向量

[0028]在一些实施例中,所述基于所述第一相似度矩阵,对所述翻译记忆译文的词向量实施无对应惩罚,得到降噪后的词向量,包括:
[0029]获取无对应惩罚阈值;
[0030]将所述第一相似度矩阵中相似度值均小于所述无对应惩罚阈值的列确定为需要实施无对应惩罚的目标词向量;
[0031]将所述目标词向量与所述无对应惩罚阈值相乘,得到降噪后的目标词向量,将所述降噪后的目标词向量和所述翻译记忆译文的词向量中未实施无对应惩罚的词向量,作为降噪后的词向量

[0032]第二方面,根据本专利技术提供一种翻译机器输入降噪装置,包括:
[0033]获取单元,用于获取待翻译原文对应的翻译记忆译文;
[0034]预处理单元,用于对所述待翻译原文和所述翻译记忆译文进行预处理,得到所述待翻译原文的词向量和所述翻译记忆译文的词向量;
[0035]降噪单元,用于对所述翻译记忆译文的词向量进行降噪处理,得到降噪后的词向
量,所述降噪处理用于降低词性和
/
或词义对目标译文的影响;
[0036]翻译单元,用于将所述待翻译原文的词向量和所述降噪后的词向量输入至翻译机器,输出所述目标译文;
[0037]其中,所述翻译机器为带翻译记忆功能的翻译机器

[0038]第三方面,本专利技术还提供一种电子设备,包括存储器

处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面任一项所述翻译机器输入降噪方法

[0039]第四方面,本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面任一项所述翻译机器输入降噪方法

[0040]第五方面,本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如第一方面任一项所述翻译机器输入降噪方法

[0041]本专利技术提供的翻译机器输入降噪方法

装置和电子设备,首先获取待翻译原文对应的翻译记忆译文;通过对待翻译本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种翻译机器输入降噪方法,其特征在于,包括:获取待翻译原文对应的翻译记忆译文;对所述待翻译原文和所述翻译记忆译文进行预处理,得到所述待翻译原文的词向量和所述翻译记忆译文的词向量;对所述翻译记忆译文的词向量进行降噪处理,得到降噪后的词向量,所述降噪处理用于降低词性和
/
或词义对目标译文的影响;将所述待翻译原文的词向量和所述降噪后的词向量输入至翻译机器,输出所述目标译文;其中,所述翻译机器为带翻译记忆功能的翻译机器
。2.
根据权利要求1所述的翻译机器输入降噪方法,其特征在于,所述对所述待翻译原文和所述翻译记忆译文进行预处理,得到所述待翻译原文的词向量和所述翻译记忆译文的词向量,包括:分别对所述待翻译原文和所述翻译记忆译文进行分词

词性标注

词嵌入,得到所述待翻译原文的词向量和所述翻译记忆译文的词向量
。3.
根据权利要求2所述的翻译机器输入降噪方法,其特征在于,所述对所述翻译记忆译文的词向量进行降噪处理,得到降噪后的词向量,包括:对被标注为实词的所述翻译记忆译文的词向量进行实词惩罚,得到降噪后的词向量,所述实词惩罚用于降低词性对目标译文的影响
。4.
根据权利要求2所述的翻译机器输入降噪方法,其特征在于,所述对所述翻译记忆译文的词向量进行降噪处理,得到降噪后的词向量,包括:对所述待翻译原文的词向量和所述翻译记忆译文的词向量进行相似度计算,得到第一相似度矩阵;基于所述第一相似度矩阵,对所述翻译记忆译文的词向量实施无对应惩罚,得到降噪后的词向量,所述无对应惩罚用于降低词义对目标译文的影响
。5.
根据权利要求2所述的翻译机器输入降噪方法,其特征在于,所述对所述翻译记忆译文的词向量进行降噪处理,得到降噪后的词向量,包括:对被标注为实词的所述翻译记忆译文的词向量进行实词惩罚,得到降噪后的第一词向量,所述实词惩罚用于降低词性对目标译文的影响;对所述待翻译原文的词向量和所述降噪后的第一词向量进行相似度计算,得到第二相似度矩阵;基于所述第二相似度矩阵,对所述降噪后的第一词向量进行无对应惩罚,得到降噪后的词向量,所述无对应惩罚用于降低词义对目标译文的影响
。6.
根据权利要求2所述的翻译机器输入降噪方法,其特征在于,所...

【专利技术属性】
技术研发人员:蔡洁
申请(专利权)人:传神语联网网络科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1