机器翻译方法和装置制造方法及图纸

技术编号:21299522 阅读:49 留言:0更新日期:2019-06-12 07:54
本公开实施例公开了机器翻译方法和装置。该方法的具体实施方式包括:获取待翻译文本;对于该待翻译文本中的待翻译词语,在预先建立的记录表中,查找与该待翻译词语匹配的源端词语,其中,该记录表用于表征源端词语、源端词语的第一源端上下文信息和目标端词语之间的对应关系;响应于查找到与该待翻译词语匹配的源端词语,从该待翻译文本中,获取该待翻译词语的第二源端上下文信息;将与该待翻译词语匹配的源端词语确定为源端匹配词语,以及基于该第二源端上下文信息和与该源端匹配词语对应的第一源端上下文信息,确定该待翻译词语对应的目标词。该实施方式提供了新的机器翻译方式。

Machine Translation Method and Device

The embodiment of the present disclosure discloses a machine translation method and device. Specific implementations of the method include: acquiring the text to be translated; searching the source words matching the translation words in the pre-established record table for the untranslated words in the text to be translated, in which the record table is used to represent the corresponding relationship between the source words, the first source context information of the source words and the target words; and responding to the search and find the corresponding relationship between the source words and the target words. The source-side words to be translated are matched, and the second source-side context information of the word to be translated is obtained from the text to be translated; the source-side words matched with the word to be translated are identified as source-side matched words, and the target of the word to be translated is determined based on the second source-side context information and the first source-side context information corresponding to the source-side matched words. Words. The embodiment provides a new machine translation method.

【技术实现步骤摘要】
机器翻译方法和装置
本公开实施例涉及计算机
,具体涉及机器翻译方法和装置。
技术介绍
机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支,也是人工智能的终极目标之一。机器翻译技术的发展一直与计算机技术、信息论、语言学等学科的发展紧密相随。从早期的词典匹配,到词典结合语言学专家知识的规则翻译,再到基于语料库的统计机器翻译,随着计算机计算能力的提升和多语言信息的爆发式增长。
技术实现思路
本公开实施例提出了机器翻译方法和装置。第一方面,本公开实施例提供了一种机器翻译方法,该方法包括:获取待翻译文本;对于上述待翻译文本中的待翻译词语,在预先建立的记录表中,查找与上述待翻译词语匹配的源端词语,其中,上述记录表用于表征源端词语、源端词语的第一源端上下文信息和目标端词语之间的对应关系;响应于查找到与上述待翻译词语匹配的源端词语,从上述待翻译文本中,获取上述待翻译词语的第二源端上下文信息;将与上述待翻译词语匹配的源端词语确定为源端匹配词语,以及基于上述第二源端上下文信息和与上述源端匹配词语对应的第一源端上下文信息,确定上述待翻译词语对应的目标词。在一些实施例中,上述记录表还包括与目标端词语对应的第一目标端上下文信息;以及上述方法还包括:获取基于待翻译词语的上下文信息确定的第二目标端上下文信息;以及上述将与上述待翻译词语匹配的源端词语确定为源端匹配词语,以及基于上述第二源端上下文信息和与上述源端匹配词语对应的第一源端上下文信息,确定上述待翻译词语对应的目标词,包括:根据上述第二源端上下文信息、上述第二目标端上下文信息以及上述源端匹配词语对应的第一源端上下文信息、第一目标端上下文信息,确定上述目标词。在一些实施例中,上述根据上述第二源端上下文信息、上述第二目标端上下文信息以及上述源端匹配词语对应的第一源端上下文信息、第一目标端上下文信息,确定上述目标词,包括:根据上述源端匹配词语对应的第一源端上下文信息和上述第二源端上下文信息,确定第一上下文匹配度;根据上述源端匹配词语对应的第一目标端上下文信息和上述第二目标端上下文信息,确定第二上下文匹配度;基于上述第一上下文匹配度和上述第二上下文匹配度,确定上述待翻译词语对应的目标词。在一些实施例中,上述记录表中的源端词语对应至少一个目标端词语;以及上述将与上述待翻译词语匹配的源端词语确定为源端匹配词语,以及基于上述第二源端上下文信息和与上述源端匹配词语对应的第一源端上下文信息,确定上述待翻译词语对应的目标词,包括:根据上述记录表,确定上述待翻译词语的第一候选目标词以及对应的第一词语匹配度;根据预先建立的第一词表,确定上述待翻译词语的第二候选目标词以及对应的第二词语匹配度,其中,上述第一词表用于表征源语言形式的词语、目标语言形式的词语以及匹配度这三者之间的对应关系;根据上述第一词语匹配度和上述第二词语匹配度,从上述第一候选目标词和上述第二候选目标词中,确定上述待翻译词语对应的目标词。在一些实施例中,上述方法还包括:响应于未查找到与上述待翻译词语匹配的源端词语,根据预先建立的第二词表,确定上述待翻译词语对应的目标词,其中,上述第二词表用于表征源语言形式的词语与目标语言形式的词语之间的对应关系。在一些实施例中,上述记录表通过以下方式建立:获取历史待翻译文本;将上述历史待翻译文本转换为历史初始翻译文本,以及展示上述历史初始翻译文本;响应于确定检测到用户对上述历史初始翻译文本中的历史目标端词语的修改,获取修改相关信息,其中,上述修改相关信息包括该修改针对的历史目标端词语、修改后历史目标端词语、历史待翻译文本中对应的历史源端词语和上述历史源端词语对应的历史第一源端上下文信息;根据上述修改相关信息,生成上述记录表。在一些实施例中,上述修改相关信息还包括:修改针对的历史目标端词语的第一目标端上下文信息。第二方面,本公开实施例提供了一种机器翻译装置,该装置包括:第一获取单元,被配置成获取待翻译文本;查找单元,被配置成对于上述待翻译文本中的待翻译词语,在预先建立的记录表中,查找与上述待翻译词语匹配的源端词语,其中,上述记录表用于表征源端词语、源端词语的第一源端上下文信息和目标端词语之间的对应关系;第二获取单元,被配置成响应于查找到与上述待翻译词语匹配的源端词语,从上述待翻译文本中,获取上述待翻译词语的第二源端上下文信息;第一确定单元,被配置成将与上述待翻译词语匹配的源端词语确定为源端匹配词语,以及基于上述第二源端上下文信息和与上述源端匹配词语对应的第一源端上下文信息,确定上述待翻译词语对应的目标词。在一些实施例中,上述记录表还包括与目标端词语对应的第一目标端上下文信息;以及上述装置还包括:第三获取单元,被配置成获取基于待翻译词语的上下文信息确定的第二目标端上下文信息;以及上述第一确定单元,还被配置成:根据上述第二源端上下文信息、上述第二目标端上下文信息以及上述源端匹配词语对应的第一源端上下文信息、第一目标端上下文信息,确定上述目标词。在一些实施例中,上述第一确定单元,还被配置成:根据上述源端匹配词语对应的第一源端上下文信息和上述第二源端上下文信息,确定第一上下文匹配度;根据上述源端匹配词语对应的第一目标端上下文信息和上述第二目标端上下文信息,确定第二上下文匹配度;基于上述第一上下文匹配度和上述第二上下文匹配度,确定上述待翻译词语对应的目标词。在一些实施例中,上述记录表中的源端词语对应至少一个目标端词语;以及上述第一确定单元,还被配置成:根据上述记录表,确定上述待翻译词语的第一候选目标词以及对应的第一词语匹配度;根据预先建立的第一词表,确定上述待翻译词语的第二候选目标词以及对应的第二词语匹配度,其中,上述第一词表用于表征源语言形式的词语、目标语言形式的词语以及匹配度这三者之间的对应关系;根据上述第一词语匹配度和上述第二词语匹配度,从上述第一候选目标词和上述第二候选目标词中,确定上述待翻译词语对应的目标词。在一些实施例中,上述装置还包括:第二确定单元,被配置成响应于未查找到与上述待翻译词语匹配的源端词语,根据预先建立的第二词表,确定上述待翻译词语对应的目标词,其中,上述第二词表用于表征源语言形式的词语与目标语言形式的词语之间的对应关系。在一些实施例中,上述记录表通过以下方式建立:获取历史待翻译文本;将上述历史待翻译文本转换为历史初始翻译文本,以及展示上述历史初始翻译文本;响应于确定检测到用户对上述历史初始翻译文本中的历史目标端词语的修改,获取修改相关信息,其中,上述修改相关信息包括该修改针对的历史目标端词语、修改后历史目标端词语、历史待翻译文本中对应的历史源端词语和上述历史源端词语对应的历史第一源端上下文信息;根据上述修改相关信息,生成上述记录表。在一些实施例中,上述修改相关信息还包括:修改针对的历史目标端词语的第一目标端上下文信息。第三方面,本公开实施例提供了一种电子设备,该电子设备包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如第一方面中任一实现方式描述的方法。第四方面,本公开实施例提供了一种计算机可读介质,其上存储有本文档来自技高网...

【技术保护点】
1.一种机器翻译方法,包括:获取待翻译文本;对于所述待翻译文本中的待翻译词语,在预先建立的记录表中,查找与所述待翻译词语匹配的源端词语,其中,所述记录表用于表征源端词语、源端词语的第一源端上下文信息和目标端词语之间的对应关系;响应于查找到与所述待翻译词语匹配的源端词语,从所述待翻译文本中,获取所述待翻译词语的第二源端上下文信息;将与所述待翻译词语匹配的源端词语确定为源端匹配词语,以及基于所述第二源端上下文信息和与所述源端匹配词语对应的第一源端上下文信息,确定所述待翻译词语对应的目标词。

【技术特征摘要】
1.一种机器翻译方法,包括:获取待翻译文本;对于所述待翻译文本中的待翻译词语,在预先建立的记录表中,查找与所述待翻译词语匹配的源端词语,其中,所述记录表用于表征源端词语、源端词语的第一源端上下文信息和目标端词语之间的对应关系;响应于查找到与所述待翻译词语匹配的源端词语,从所述待翻译文本中,获取所述待翻译词语的第二源端上下文信息;将与所述待翻译词语匹配的源端词语确定为源端匹配词语,以及基于所述第二源端上下文信息和与所述源端匹配词语对应的第一源端上下文信息,确定所述待翻译词语对应的目标词。2.根据权利要求1所述的方法,所述记录表还包括与目标端词语对应的第一目标端上下文信息;以及所述方法还包括:获取基于待翻译词语的上下文信息确定的第二目标端上下文信息;以及所述将与所述待翻译词语匹配的源端词语确定为源端匹配词语,以及基于所述第二源端上下文信息和与所述源端匹配词语对应的第一源端上下文信息,确定所述待翻译词语对应的目标词,包括:根据所述第二源端上下文信息、所述第二目标端上下文信息以及所述源端匹配词语对应的第一源端上下文信息、第一目标端上下文信息,确定所述目标词。3.根据权利要求2所述的方法,其中,所述根据所述第二源端上下文信息、所述第二目标端上下文信息以及所述源端匹配词语对应的第一源端上下文信息、第一目标端上下文信息,确定所述目标词,包括:根据所述源端匹配词语对应的第一源端上下文信息和所述第二源端上下文信息,确定第一上下文匹配度;根据所述源端匹配词语对应的第一目标端上下文信息和所述第二目标端上下文信息,确定第二上下文匹配度;基于所述第一上下文匹配度和所述第二上下文匹配度,确定所述待翻译词语对应的目标词。4.根据权利要求1所述的方法,其中,所述记录表中的源端词语对应至少一个目标端词语;以及所述将与所述待翻译词语匹配的源端词语确定为源端匹配词语,以及基于所述第二源端上下文信息和与所述源端匹配词语对应的第一源端上下文信息,确定所述待翻译词语对应的目标词,包括:根据所述记录表,确定所述待翻译词语的第一候选目标词以及对应的第一词语匹配度;根据预先建立的第一词表,确定所述待翻译词语的第二候选目标词以及对应的第二词语匹配度,其中,所述第一词表用于表征源语言形式的词语、目标语言形式的词语以及匹配度这三者之间的对应关系;根据所述第一词语匹配度和所述第二词语匹配度,从所述第一候选目标词和所述第二候选目标词中,确定所述待翻译词语对应的目标词。5.根据权利要求1所述的方法,其中,所述方法还包括:响应于未查找到与所述待翻译词语匹配的源端词语,根据预先建立的第二词表,确定所述待翻译词语对应的目标词,其中,所述第二词表用于表征源语言形式的词语与目标语言形式的词语之间的对应关系。6.根据权利要求1-5中任一项所述的方法,其中,所述记录表通过以下方式建立:获取历史待翻译文本;将所述历史待翻译文本转换为历史初始翻译文本,以及展示所述历史初始翻译文本;响应于确定检测到用户对所述历史初始翻译文本中的历史目标端词语的修改,获取修改相关信息,其中,所述修改相关信息包括该修改针对的历史目标端词语、修改后历史目标端词语、历史待翻译文本中对应的历史源端词语和所述历史源端词语对应的历史第一源端上下文信息;根据所述修改相关信息,生成所述记录表。7.根据权利要求6所述的方法,其中,所述修改相关信息还包括:修改针对的历史目标端词语的第一目标端上下文信息。8.一种机器翻译装置,包...

【专利技术属性】
技术研发人员:周浩李磊
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1