【技术实现步骤摘要】
翻译机器输入降噪方法、装置和电子设备
[0001]本专利技术涉及计算机
,尤其涉及一种翻译机器输入降噪方法
、
装置和电子设备
。
技术介绍
[0002]随着科技的发展,机器翻译技术取得了巨大的进步,机器翻译技术的关键是提高翻译质量和效率
。
相关技术中,采用带有翻译记忆
(Translation Memory
,
TM)
功能的翻译机器进行翻译,具体是针对一个待翻译的句子,翻译机器的机器翻译系统从
TM
库中检索与其相似的句子
。
若找到完全匹配的句子,则将其目标译文作为答案返回;若未找到,则将最相似的几个句子译文作为
TM
参考,对机器翻译的结果进行干涉,将待翻译的句子和由翻译记忆干涉后的译文输入至机器翻译系统
。
然而,使用
TM
对翻译过程进行干涉可能对翻译结果产生负面影响,导致翻译准确率较低
。
技术实现思路
[0003]本专利技术提供一种翻译机器输入降噪方法
、
装置和电子设备,用以解决相关技术中采用带
TM
的翻译机器进行翻译时,存在翻译记忆对翻译结果产生负面影响,导致翻译准确率较低等缺陷
。
[0004]第一方面,本专利技术提供一种翻译机器输入降噪方法,包括:
[0005]获取待翻译原文对应的翻译记忆译文;
[0006]对所述待翻译原文和所述翻译记忆译文进行预 ...
【技术保护点】
【技术特征摘要】
1.
一种翻译机器输入降噪方法,其特征在于,包括:获取待翻译原文对应的翻译记忆译文;对所述待翻译原文和所述翻译记忆译文进行预处理,得到所述待翻译原文的词向量和所述翻译记忆译文的词向量;对所述翻译记忆译文的词向量进行降噪处理,得到降噪后的词向量,所述降噪处理用于降低词性和
/
或词义对目标译文的影响;将所述待翻译原文的词向量和所述降噪后的词向量输入至翻译机器,输出所述目标译文;其中,所述翻译机器为带翻译记忆功能的翻译机器
。2.
根据权利要求1所述的翻译机器输入降噪方法,其特征在于,所述对所述待翻译原文和所述翻译记忆译文进行预处理,得到所述待翻译原文的词向量和所述翻译记忆译文的词向量,包括:分别对所述待翻译原文和所述翻译记忆译文进行分词
、
词性标注
、
词嵌入,得到所述待翻译原文的词向量和所述翻译记忆译文的词向量
。3.
根据权利要求2所述的翻译机器输入降噪方法,其特征在于,所述对所述翻译记忆译文的词向量进行降噪处理,得到降噪后的词向量,包括:对被标注为实词的所述翻译记忆译文的词向量进行实词惩罚,得到降噪后的词向量,所述实词惩罚用于降低词性对目标译文的影响
。4.
根据权利要求2所述的翻译机器输入降噪方法,其特征在于,所述对所述翻译记忆译文的词向量进行降噪处理,得到降噪后的词向量,包括:对所述待翻译原文的词向量和所述翻译记忆译文的词向量进行相似度计算,得到第一相似度矩阵;基于所述第一相似度矩阵,对所述翻译记忆译文的词向量实施无对应惩罚,得到降噪后的词向量,所述无对应惩罚用于降低词义对目标译文的影响
。5.
根据权利要求2所述的翻译机器输入降噪方法,其特征在于,所述对所述翻译记忆译文的词向量进行降噪处理,得到降噪后的词向量,包括:对被标注为实词的所述翻译记忆译文的词向量进行实词惩罚,得到降噪后的第一词向量,所述实词惩罚用于降低词性对目标译文的影响;对所述待翻译原文的词向量和所述降噪后的第一词向量进行相似度计算,得到第二相似度矩阵;基于所述第二相似度矩阵,对所述降噪后的第一词向量进行无对应惩罚,得到降噪后的词向量,所述无对应惩罚用于降低词义对目标译文的影响
。6.
根据权利要求2所述的翻译机器输入降噪方法,其特征在于,所...
【专利技术属性】
技术研发人员:蔡洁,
申请(专利权)人:传神语联网网络科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。