翻译译文的提供方法、装置和系统制造方法及图纸

技术编号:9872540 阅读:158 留言:0更新日期:2014-04-04 05:37
本发明专利技术提出一种翻译译文的提供方法、装置和系统,其中,该方法包括:接收客户端发送的翻译请求,并获取客户端的当前位置信息,其中,翻译请求包括待翻译内容和目标语言类型;根据目标语言类型获取与目标语言类型对应的地图数据和预设互信息集合;根据当前位置信息、地图数据和预设互信息集合获取待翻译内容的位置特征;根据位置特征和预设翻译模型获取待翻译内容的翻译译文,并将翻译译文发送至客户端。本发明专利技术实施例的翻译译文的提供方法使获取的翻译译文能够满足用户在特定位置上的翻译需求,并且翻译结果更符合用户预期。特别是对于一词多译的情况,能够快速准确的为用户提供翻译结果,极大的改善了用户的翻译体验。

【技术实现步骤摘要】
翻译译文的提供方法、装置和系统
本专利技术涉及机器翻译领域,特别涉及一种翻译译文的提供方法、装置和系统。
技术介绍
随着机器翻译技术的不断发展,用户可随时通过在线翻译在多种语言对之间进行翻译。特别是随着移动终端制造技术的发展,移动终端上的在线翻译应用程序也日益丰富,这使得用户随时随地都可以进行翻译。例如用户出国旅游时,可随时通过键盘输入、语音输入、拍照加OCR识别等输入方式将看到的路标、招牌、菜单、景点介绍等等输入到在线翻译应用程序中进行翻译。目前机器翻译在译文选择时主要考虑两方面的因素,即翻译概率和语言模型概率。其中,翻译概率是基于一个大规模的源语言到目标语言的平行语料库,经过词对齐和短语抽取之后训练得到的,体现的是一个源语言短语翻译到一个目标语言短语的可能性;语言模型概率是基于目标语言的大规模单语语料库统计得到的目标语言词序列的出现概率。因而,目前机器翻译中源语言短语的候选翻译的选择取决于短语本身以及该短语所处在的上下文句子。但是,存在源语言中的一个短语对应目标语言中的多个译文的情况,现有的机器翻译系统无法从多个译文中为用户筛选出更符合用户当前需求的译文。
技术实现思路
本专利技术旨在至少在一定程度上解决上述技术问题。为此,本专利技术的第一个目的在于提出一种翻译译文的提供方法,该方法能够满足用户在特定位置上的翻译需求,快速准确的为用户提供翻译结果,极大的改善了用户的翻译体验。为达上述目的,根据本专利技术第一方面实施例提出了一种翻译译文的提供方法,包括:接收客户端发送的翻译请求,并获取所述客户端的当前位置信息,其中,所述翻译请求包括待翻译内容和目标语言类型;根据所述目标语言类型获取与所述目标语言类型对应的地图数据和预设互信息集合;根据所述当前位置信息、所述地图数据和所述预设互信息集合获取所述待翻译内容的位置特征;根据所述位置特征和预设翻译模型获取所述待翻译内容的翻译译文,并将所述翻译译文发送至所述客户端。本专利技术实施例的翻译译文的提供方法,通过获取发送翻译请求的客户端的当前位置信息,并获取与该当前位置信息相关的翻译译文,从而使获取的翻译译文能够满足用户在特定位置上的翻译需求,并且翻译结果更符合用户预期。特别是对于一词多译的情况,能够快速准确的为用户提供翻译结果,极大的改善了用户的翻译体验。本专利技术第二方面实施例提供了一种翻译译文的提供装置,包括:接收模块,用于接收客户端发送的翻译请求,其中,所述翻译请求包括待翻译内容和目标语言类型;第一获取模块,用于获取所述客户端的当前位置信息;第二获取模块,用于根据所述目标语言类型获取与所述目标语言类型对应的地图数据和预设互信息集合;第三获取模块,用于根据所述当前位置信息、所述地图数据和所述预设互信息集合获取所述待翻译内容的位置特征;提供模块,用于根据所述位置特征和预设翻译模型获取所述待翻译内容的翻译译文,并将所述翻译译文发送至所述客户端。本专利技术实施例的翻译译文的提供装置,通过获取发送翻译请求的客户端的当前位置信息,并获取与该当前位置信息相关的翻译译文,从而使获取的翻译译文能够满足用户在特定位置上的翻译需求,并且翻译结果更符合用户预期。特别是对于一词多译的情况,能够快速准确的为用户提供翻译结果,极大的改善了用户的翻译体验。本专利技术第三方面实施例提供了一种翻译译文的提供系统,包括:本专利技术第二方面实施例所述的翻译译文的提供装置;以及客户端。本专利技术实施例的翻译译文的提供系统,通过获取发送翻译请求的客户端的当前位置信息,并获取与该当前位置信息相关的翻译译文,从而使获取的翻译译文能够满足用户在特定位置上的翻译需求,并且翻译结果更符合用户预期。特别是对于一词多译的情况,能够快速准确的为用户提供翻译结果,极大的改善了用户的翻译体验。本专利技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:图1为根据本专利技术一个实施例的翻译译文的提供方法的流程图;图2为根据本专利技术一个具体实施例的翻译译文的提供方法的流程图;图3为根据本专利技术一个实施例的建立预算互信息集合的方法的流程图;图4为根据本专利技术一个实施例的获取每个地标词汇的位置得分的方法的流程图;图5为根据本专利技术一个实施例的获取待翻译内容的位置特征的方法的流程图;图6为根据本专利技术一个实施例的翻译译文的提供装置的结构示意图;图7为根据本专利技术一个具体实施例的翻译译文的提供装置的结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。在本专利技术的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。在本专利技术的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本专利技术中的具体含义。在现有的机器翻译技术中,源语言语句的候选翻译的选择只取决于源语言语句中短语本身以及短语所处在的上下文句子,当源语言语句含的短语的译文较多时,获得的该源语言语句的译文更多,这就需要用户根据需要在众多译文中选择,或者翻译系统自动为用户提供使用率较高的译文,但却不一定是用户所需要的。而当为用户提供翻译译文时,如果根据用户发出翻译请求时所处的地理位置提供翻译译文,则会使翻译译文更加准确。例如:当一个不懂英文的中国游客在翻译系统中输入“park”这个多义词时,他要找的中文翻译到底是什么便与他彼时彼刻正处于的位置有关。若此时他处于公园、动物园、旅游景点等的门口,则park很可能是“公园”的意思;但倘若他的旁边是商务区、办公区、马路等,则park便很可能是“停车场”的意思。为此,本专利技术提出了一种翻译译文的提供方法、装置和系统。下面参考附图描述根据本专利技术实施例的翻译译文的提供方法、装置和系统。一种翻译译文的提供方法,包括以下步骤:接收客户端发送的翻译请求,并获取客户端的当前位置信息,其中,翻译请求包括待翻译内容和目标语言类型;根据目标语言类型获取与目标语言类型对应的地图数据和预设互信息集合;根据当前位置信息、地图数据和预设互信息集合获取待翻译内容的位置特征;根据位置特征和预设翻译模型获取待翻译内容的翻译译文,并将翻译译文发送至客户端。图1为根据本专利技术一个实施例的翻译译文的提供方法的流程图。如图1所示,该翻译译文的提供方法包括以下步骤。S101,接收客户端发送的本文档来自技高网...
翻译译文的提供方法、装置和系统

【技术保护点】
一种翻译译文的提供方法,其特征在于,包括:接收客户端发送的翻译请求,并获取所述客户端的当前位置信息,其中,所述翻译请求包括待翻译内容和目标语言类型;根据所述目标语言类型获取与所述目标语言类型对应的地图数据和预设互信息集合;根据所述当前位置信息、所述地图数据和所述预设互信息集合获取所述待翻译内容的位置特征;根据所述位置特征和预设翻译模型获取所述待翻译内容的翻译译文,并将所述翻译译文发送至所述客户端。

【技术特征摘要】
1.一种翻译译文的提供方法,其特征在于,包括:接收客户端发送的翻译请求,并获取所述客户端的当前位置信息,其中,所述翻译请求包括待翻译内容和目标语言类型;根据所述目标语言类型获取与所述目标语言类型对应的地图数据和预设互信息集合,其中,所述预设互信息集合为预先建立的包括任意地标信息中的词汇之间共同出现的互信息的集合;根据所述当前位置信息、所述地图数据和所述预设互信息集合获取所述待翻译内容的位置特征;根据所述位置特征和预设翻译模型获取所述待翻译内容的翻译译文,并将所述翻译译文发送至所述客户端。2.如权利要求1所述的翻译译文的提供方法,其特征在于,所述根据所述当前位置信息、所述地图数据和所述预设互信息集合获取所述待翻译内容的位置特征具体包括:根据所述当前位置信息和所述地图数据获取与所述当前位置信息距离小于预设阈值的多个地标信息,并分别记录所述多个地标信息与所述当前位置信息的距离;对所述多个地标信息进行分词以获取M个地标词汇,其中,M为正整数;根据所述多个地标信息和所述多个地标信息与所述当前位置信息的距离分别获取所述M个地标词汇的位置得分;根据所述M个地标词汇的位置得分和所述互信息集合获取所述待翻译内容的位置特征。3.如权利要求2所述的翻译译文的提供方法,其特征在于,所述根据所述多个地标信息和所述多个地标信息与所述当前位置信息的距离分别获取所述M个地标词汇的位置得分,具体包括:对于每个地标词汇w,从所述M个地标信息中获取包括所述地标词汇w的K个地标信息,其中,K为正整数;获取所述K个地标信息到所述当前位置信息的平均距离;根据所述地标词汇w在所述K个地标信息中的出现次数和所述平均距离通过以下公式获取所述地标词汇w的位置得分:其中,score(w)为所述地标词汇w的位置得分,为所述K个地标信息到所述当前位置信息的平均距离,其中,pk表示所述K个地标信息中第k个地标信息,disk为所述第k个地标信息pk与所述当前位置信息的距离。4.如权利要求2所述的翻译译文的提供方法,其特征在于,所述根据所述M个地标词汇的位置得分和所述互信息集合获取所述待翻译内容的位置特征,具体包括:获取所述待翻译内容中的至少一个短语,并获取所述至少一个短语中每个短语对应的多个候选翻译短语,其中,每个所述候选翻译短语中包括N个目标语言词汇,N为正整数;根据所述预设互信息集合分别获取所述M个地标词汇和所述N个目标语言词汇中每个地标词汇与每个目标语言词汇之间的互信息;根据所述每个地标词汇与每个目标语言词汇之间的互信息与每个地标词汇的位置得分获取相应的候选翻译短语基于位置的特征分值;根据每个候选翻译短语基于位置的特征分值获取所述待翻译内容的位置特征。5.如权利要求4所述的翻译译文的提供方法,其特征在于,通过以下公式获取每个候选翻译短语pt基于位置的特征分值:其中,f(pt|LBM(S))为所述候选翻译短语pt基于位置的特征分值,LB_Cooc(wi,tj)为所述M个地标词汇中第i个地标词汇wi与所述N个目标语言词汇中第j个目标语言词汇tj的互信息,score(wi)为所述第i个地标词汇wi的位置得分,为待翻译内容的位置模型。6.如权利要求1-5任一项所述的翻译译文的提供方法,其特征在于,所述预设互信息集合通过以下步骤建立:获取第一语言的地图数据;根据所述第一语言的地图数据获取地图上任意距离小于预设阈值的两个地标信息,以获取多对地标信息;根据所述多对地标信息获取多个第一语言地标词汇;分别获取每个第一语言地标词汇的出现概率,并获取任意两个第一语言地标词汇之间的共现概率;根据所述每个第一语言地标词汇的出现概率和所述任意两个第一语言地标词汇之间的共现概率获取所述任意两个第一语言地标词汇之间的互信息,以建立第一语言的预设互信息集合。7.如权利要求6所述的翻译译文的提供方法,其特征在于,通过以下公式获取所述任意两个第一语言地标词汇之间的互信息:其中,w1和w2为两个第一语言地标词汇,LB_Cooc(w1,w2)为所述w1和所述w2之间的关联紧密度,I(w1;w2)为所述w1和所述w2之间的互信息,p(w1w2)为所述w1和所述w2的共现概率,p(w1)为所述w1的出现概率,p(w2)为所述w2的出现概率。8.一种翻译译文的提供装置,其特征在于,包括:接收模块,用于接收客户端发送的翻译请求,其中,所述翻译请求包括待翻译内容和目标语言类型;第一获取模块,用于获取所述客户端的当前位置信...

【专利技术属性】
技术研发人员:王海峰赵世奇吴华
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1