The embodiment of the present disclosure discloses a machine translation method and device. Specific implementations of the method include: acquiring the text to be translated; searching the source words matching the translation words in the pre-established record table for the untranslated words in the text to be translated, in which the record table is used to represent the corresponding relationship between the source words, the first source context information of the source words and the target words; and responding to the search and find the corresponding relationship between the source words and the target words. The source-side words to be translated are matched, and the second source-side context information of the word to be translated is obtained from the text to be translated; the source-side words matched with the word to be translated are identified as source-side matched words, and the target of the word to be translated is determined based on the second source-side context information and the first source-side context information corresponding to the source-side matched words. Words. The embodiment provides a new machine translation method.
【技术实现步骤摘要】
机器翻译方法和装置
本公开实施例涉及计算机
,具体涉及机器翻译方法和装置。
技术介绍
机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支,也是人工智能的终极目标之一。机器翻译技术的发展一直与计算机技术、信息论、语言学等学科的发展紧密相随。从早期的词典匹配,到词典结合语言学专家知识的规则翻译,再到基于语料库的统计机器翻译,随着计算机计算能力的提升和多语言信息的爆发式增长。
技术实现思路
本公开实施例提出了机器翻译方法和装置。第一方面,本公开实施例提供了一种机器翻译方法,该方法包括:获取待翻译文本;对于上述待翻译文本中的待翻译词语,在预先建立的记录表中,查找与上述待翻译词语匹配的源端词语,其中,上述记录表用于表征源端词语、源端词语的第一源端上下文信息和目标端词语之间的对应关系;响应于查找到与上述待翻译词语匹配的源端词语,从上述待翻译文本中,获取上述待翻译词语的第二源端上下文信息;将与上述待翻译词语匹配的源端词语确定为源端匹配词语,以及基于上述第二源端上下文信息和与上述源端匹配词语对应的第一源端上下文信息,确定上述待翻译词语对应的目标词。在一些实施例中,上述记录表还包括与目标端词语对应的第一目标端上下文信息;以及上述方法还包括:获取基于待翻译词语的上下文信息确定的第二目标端上下文信息;以及上述将与上述待翻译词语匹配的源端词语确定为源端匹配词语,以及基于上述第二源端上下文信息和与上述源端匹配词语对应的第一源端上下文信息,确定上述待翻译词语对应的目标词,包括:根据上述第二源端上下文信息、上 ...
【技术保护点】
1.一种机器翻译方法,包括:获取待翻译文本;对于所述待翻译文本中的待翻译词语,在预先建立的记录表中,查找与所述待翻译词语匹配的源端词语,其中,所述记录表用于表征源端词语、源端词语的第一源端上下文信息和目标端词语之间的对应关系;响应于查找到与所述待翻译词语匹配的源端词语,从所述待翻译文本中,获取所述待翻译词语的第二源端上下文信息;将与所述待翻译词语匹配的源端词语确定为源端匹配词语,以及基于所述第二源端上下文信息和与所述源端匹配词语对应的第一源端上下文信息,确定所述待翻译词语对应的目标词。
【技术特征摘要】
1.一种机器翻译方法,包括:获取待翻译文本;对于所述待翻译文本中的待翻译词语,在预先建立的记录表中,查找与所述待翻译词语匹配的源端词语,其中,所述记录表用于表征源端词语、源端词语的第一源端上下文信息和目标端词语之间的对应关系;响应于查找到与所述待翻译词语匹配的源端词语,从所述待翻译文本中,获取所述待翻译词语的第二源端上下文信息;将与所述待翻译词语匹配的源端词语确定为源端匹配词语,以及基于所述第二源端上下文信息和与所述源端匹配词语对应的第一源端上下文信息,确定所述待翻译词语对应的目标词。2.根据权利要求1所述的方法,所述记录表还包括与目标端词语对应的第一目标端上下文信息;以及所述方法还包括:获取基于待翻译词语的上下文信息确定的第二目标端上下文信息;以及所述将与所述待翻译词语匹配的源端词语确定为源端匹配词语,以及基于所述第二源端上下文信息和与所述源端匹配词语对应的第一源端上下文信息,确定所述待翻译词语对应的目标词,包括:根据所述第二源端上下文信息、所述第二目标端上下文信息以及所述源端匹配词语对应的第一源端上下文信息、第一目标端上下文信息,确定所述目标词。3.根据权利要求2所述的方法,其中,所述根据所述第二源端上下文信息、所述第二目标端上下文信息以及所述源端匹配词语对应的第一源端上下文信息、第一目标端上下文信息,确定所述目标词,包括:根据所述源端匹配词语对应的第一源端上下文信息和所述第二源端上下文信息,确定第一上下文匹配度;根据所述源端匹配词语对应的第一目标端上下文信息和所述第二目标端上下文信息,确定第二上下文匹配度;基于所述第一上下文匹配度和所述第二上下文匹配度,确定所述待翻译词语对应的目标词。4.根据权利要求1所述的方法,其中,所述记录表中的源端词语对应至少一个目标端词语;以及所述将与所述待翻译词语匹配的源端词语确定为源端匹配词语,以及基于所述第二源端上下文信息和与所述源端匹配词语对应的第一源端上下文信息,确定所述待翻译词语对应的目标词,包括:根据所述记录表,确定所述待翻译词语的第一候选目标词以及对应的第一词语匹配度;根据预先建立的第一词表,确定所述待翻译词语的第二候选目标词以及对应的第二词语匹配度,其中,所述第一词表用于表征源语言形式的词语、目标语言形式的词语以及匹配度这三者之间的对应关系;根据所述第一词语匹配度和所述第二词语匹配度,从所述第一候选目标词和所述第二候选目标词中,确定所述待翻译词语对应的目标词。5.根据权利要求1所述的方法,其中,所述方法还包括:响应于未查找到与所述待翻译词语匹配的源端词语,根据预先建立的第二词表,确定所述待翻译词语对应的目标词,其中,所述第二词表用于表征源语言形式的词语与目标语言形式的词语之间的对应关系。6.根据权利要求1-5中任一项所述的方法,其中,所述记录表通过以下方式建立:获取历史待翻译文本;将所述历史待翻译文本转换为历史初始翻译文本,以及展示所述历史初始翻译文本;响应于确定检测到用户对所述历史初始翻译文本中的历史目标端词语的修改,获取修改相关信息,其中,所述修改相关信息包括该修改针对的历史目标端词语、修改后历史目标端词语、历史待翻译文本中对应的历史源端词语和所述历史源端词语对应的历史第一源端上下文信息;根据所述修改相关信息,生成所述记录表。7.根据权利要求6所述的方法,其中,所述修改相关信息还包括:修改针对的历史目标端词语的第一目标端上下文信息。8.一种机器翻译装置,包...
【专利技术属性】
技术研发人员:周浩,李磊,
申请(专利权)人:北京字节跳动网络技术有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。