The embodiment of the invention provides a machine translation method, device and electronic device including term translation, wherein the method comprises: word segmentation of the text to be translated according to sentences, term matching of the result of word segmentation with the given technical language library, determining the terms in the text to be translated, storing the active language and the target language term pair in the given technical language library; and The terms in the text to be translated are replaced with placeholders, and based on the given terminology library, the target machine translation model is established in advance to translate and replace the replaced text, and obtain the translation results including the term translation. The embodiment of the invention can effectively overcome the problems caused by post editing, thereby effectively improving the translation efficiency and accuracy.
【技术实现步骤摘要】
包含术语翻译的机器翻译方法、装置与电子设备
本专利技术涉及机器翻译
,更具体地,涉及一种包含术语翻译的机器翻译方法、装置与电子设备。
技术介绍
在文本翻译过程中,相同的源“单词”可能会被翻译成不同的译文,这其中可能存在两方面因素的影响,其一单词本身是多义词,其二不同的译员翻译用词习惯不同。在翻译过程中,对于某些比较重要的词,希望其翻译结果是固定的,这些词即被称为“术语”。为了使译文中对这些术语的翻译是统一固定的结果,目前采用的是术语替换的方式,即根据机器翻译之后的结果,基于词对齐做译后编辑,替换译文中对术语的翻译结果。这样做虽能够实现对术语翻译的统一,但是存在的问题一是处理速度不够快,影响翻译效率,二是如果翻译有一些意译的结果,则容易改变翻译的含义,导致翻译结果不准确。
技术实现思路
为了克服上述问题或者至少部分地解决上述问题,本专利技术实施例提供一种包含术语翻译的机器翻译方法、装置与电子设备,用以有效克服在后编辑带来的问题,从而有效提高翻译效率和翻译准确性。第一方面,本专利技术实施例提供一种包含术语翻译的机器翻译方法,包括:将待翻译文本按句进行分词处理,并将分词的结果与给定术语库进行术语匹配,确定所述待翻译文本中的术语,所述给定术语库内存储有源语言和目标语言术语对;将所述待翻译文本中的术语用占位符进行替换,并基于所述给定术语库,利用预先建立的目标机器翻译模型,对所述替换后的待翻译文本进行翻译和术语替换,获取包含术语译文的翻译结果。第二方面,本专利技术 ...
【技术保护点】
1.一种包含术语翻译的机器翻译方法,其特征在于,包括:/n将待翻译文本按句进行分词处理,并将分词的结果与给定术语库进行术语匹配,确定所述待翻译文本中的术语,所述给定术语库内存储有源语言和目标语言术语对;/n将所述待翻译文本中的术语用占位符进行替换,并基于所述给定术语库,利用预先建立的目标机器翻译模型,对所述替换后的待翻译文本进行翻译和术语替换,获取包含术语译文的翻译结果。/n
【技术特征摘要】
1.一种包含术语翻译的机器翻译方法,其特征在于,包括:
将待翻译文本按句进行分词处理,并将分词的结果与给定术语库进行术语匹配,确定所述待翻译文本中的术语,所述给定术语库内存储有源语言和目标语言术语对;
将所述待翻译文本中的术语用占位符进行替换,并基于所述给定术语库,利用预先建立的目标机器翻译模型,对所述替换后的待翻译文本进行翻译和术语替换,获取包含术语译文的翻译结果。
2.根据权利要求1所述的包含术语翻译的机器翻译方法,其特征在于,在所述利用预先建立的目标机器翻译模型,对所述替换后的待翻译文本进行翻译和术语替换的步骤之前,还包括:
对训练语料句对进行分词处理,并根据分词结果依次进行词对齐处理和词性标注;
确定术语因子数,并基于所述术语因子数和词性标注的结果,对所述训练语料句对获取带占位符的训练样本句对;
利用所述带占位符的训练样本句对,训练初始化完成的seq2seqwithattention模型,获取所述目标机器翻译模型。
3.根据权利要求1或2所述的包含术语翻译的机器翻译方法,其特征在于,所述对所述替换后的待翻译文本进行翻译和术语替换的步骤具体包括:
将所述替换后的待翻译文本输入所述目标机器翻译模型,获取带占位符的译文中间结果,并基于所述给定术语库,获取所述待翻译文本中的术语对应的术语译文;
利用所述术语译文替换所述带占位符的译文中间结果中的占位符,实现译文术语替换。
4.根据权利要求2所述的包含术语翻译的机器翻译方法,其特征在于,进行词性标注的步骤具体包括:
利用隐马尔科夫模型viterbi算法,对词对齐处理的结果进行给定类型的分词的词性标注。
5.根据权利要求1或2所述的包含...
【专利技术属性】
技术研发人员:蔡洁,
申请(专利权)人:语联网武汉信息技术有限公司,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。