【技术实现步骤摘要】
翻译译文的提供方法、装置和系统
本专利技术涉及机器翻译领域,特别涉及一种翻译译文的提供方法、装置和系统。
技术介绍
随着机器翻译技术的不断发展,用户可随时通过在线翻译在多种语言对之间进行翻译。特别是随着移动终端制造技术的发展,移动终端上的在线翻译应用程序也日益丰富,这使得用户随时随地都可以进行翻译。例如用户出国旅游时,可随时通过键盘输入、语音输入、拍照加OCR识别等输入方式将看到的路标、招牌、菜单、景点介绍等等输入到在线翻译应用程序中进行翻译。目前机器翻译在译文选择时主要考虑两方面的因素,即翻译概率和语言模型概率。其中,翻译概率是基于一个大规模的源语言到目标语言的平行语料库,经过词对齐和短语抽取之后训练得到的,体现的是一个源语言短语翻译到一个目标语言短语的可能性;语言模型概率是基于目标语言的大规模单语语料库统计得到的目标语言词序列的出现概率。因而,目前机器翻译中源语言短语的候选翻译的选择取决于短语本身以及该短语所处在的上下文句子。但是,存在源语言中的一个短语对应目标语言中的多个译文的情况,现有的机器翻译系统无法从多个译文中为用户筛选出更符合用户当前需求的译文。
技术实现思路
本专利技术旨在至少在一定程度上解决上述技术问题。为此,本专利技术的第一个目的在于提出一种翻译译文的提供方法,该方法能够满足用户在特定位置上的翻译需求,快速准确的为用户提供翻译结果,极大的改善了用户的翻译体验。为达上述目的,根据本专利技术第一方面实施例提出了一种翻译译文的提供方法,包括:接收客户端发送的翻译请求,并获取所述客户端的当前位置信息,其中,所述翻译请求包括待翻译内容和目标语言类型; ...
【技术保护点】
一种翻译译文的提供方法,其特征在于,包括:接收客户端发送的翻译请求,并获取所述客户端的当前位置信息,其中,所述翻译请求包括待翻译内容和目标语言类型;根据所述目标语言类型获取与所述目标语言类型对应的地图数据和预设互信息集合;根据所述当前位置信息、所述地图数据和所述预设互信息集合获取所述待翻译内容的位置特征;根据所述位置特征和预设翻译模型获取所述待翻译内容的翻译译文,并将所述翻译译文发送至所述客户端。
【技术特征摘要】
1.一种翻译译文的提供方法,其特征在于,包括:接收客户端发送的翻译请求,并获取所述客户端的当前位置信息,其中,所述翻译请求包括待翻译内容和目标语言类型;根据所述目标语言类型获取与所述目标语言类型对应的地图数据和预设互信息集合,其中,所述预设互信息集合为预先建立的包括任意地标信息中的词汇之间共同出现的互信息的集合;根据所述当前位置信息、所述地图数据和所述预设互信息集合获取所述待翻译内容的位置特征;根据所述位置特征和预设翻译模型获取所述待翻译内容的翻译译文,并将所述翻译译文发送至所述客户端。2.如权利要求1所述的翻译译文的提供方法,其特征在于,所述根据所述当前位置信息、所述地图数据和所述预设互信息集合获取所述待翻译内容的位置特征具体包括:根据所述当前位置信息和所述地图数据获取与所述当前位置信息距离小于预设阈值的多个地标信息,并分别记录所述多个地标信息与所述当前位置信息的距离;对所述多个地标信息进行分词以获取M个地标词汇,其中,M为正整数;根据所述多个地标信息和所述多个地标信息与所述当前位置信息的距离分别获取所述M个地标词汇的位置得分;根据所述M个地标词汇的位置得分和所述互信息集合获取所述待翻译内容的位置特征。3.如权利要求2所述的翻译译文的提供方法,其特征在于,所述根据所述多个地标信息和所述多个地标信息与所述当前位置信息的距离分别获取所述M个地标词汇的位置得分,具体包括:对于每个地标词汇w,从所述M个地标信息中获取包括所述地标词汇w的K个地标信息,其中,K为正整数;获取所述K个地标信息到所述当前位置信息的平均距离;根据所述地标词汇w在所述K个地标信息中的出现次数和所述平均距离通过以下公式获取所述地标词汇w的位置得分:其中,score(w)为所述地标词汇w的位置得分,为所述K个地标信息到所述当前位置信息的平均距离,其中,pk表示所述K个地标信息中第k个地标信息,disk为所述第k个地标信息pk与所述当前位置信息的距离。4.如权利要求2所述的翻译译文的提供方法,其特征在于,所述根据所述M个地标词汇的位置得分和所述互信息集合获取所述待翻译内容的位置特征,具体包括:获取所述待翻译内容中的至少一个短语,并获取所述至少一个短语中每个短语对应的多个候选翻译短语,其中,每个所述候选翻译短语中包括N个目标语言词汇,N为正整数;根据所述预设互信息集合分别获取所述M个地标词汇和所述N个目标语言词汇中每个地标词汇与每个目标语言词汇之间的互信息;根据所述每个地标词汇与每个目标语言词汇之间的互信息与每个地标词汇的位置得分获取相应的候选翻译短语基于位置的特征分值;根据每个候选翻译短语基于位置的特征分值获取所述待翻译内容的位置特征。5.如权利要求4所述的翻译译文的提供方法,其特征在于,通过以下公式获取每个候选翻译短语pt基于位置的特征分值:其中,f(pt|LBM(S))为所述候选翻译短语pt基于位置的特征分值,LB_Cooc(wi,tj)为所述M个地标词汇中第i个地标词汇wi与所述N个目标语言词汇中第j个目标语言词汇tj的互信息,score(wi)为所述第i个地标词汇wi的位置得分,为待翻译内容的位置模型。6.如权利要求1-5任一项所述的翻译译文的提供方法,其特征在于,所述预设互信息集合通过以下步骤建立:获取第一语言的地图数据;根据所述第一语言的地图数据获取地图上任意距离小于预设阈值的两个地标信息,以获取多对地标信息;根据所述多对地标信息获取多个第一语言地标词汇;分别获取每个第一语言地标词汇的出现概率,并获取任意两个第一语言地标词汇之间的共现概率;根据所述每个第一语言地标词汇的出现概率和所述任意两个第一语言地标词汇之间的共现概率获取所述任意两个第一语言地标词汇之间的互信息,以建立第一语言的预设互信息集合。7.如权利要求6所述的翻译译文的提供方法,其特征在于,通过以下公式获取所述任意两个第一语言地标词汇之间的互信息:其中,w1和w2为两个第一语言地标词汇,LB_Cooc(w1,w2)为所述w1和所述w2之间的关联紧密度,I(w1;w2)为所述w1和所述w2之间的互信息,p(w1w2)为所述w1和所述w2的共现概率,p(w1)为所述w1的出现概率,p(w2)为所述w2的出现概率。8.一种翻译译文的提供装置,其特征在于,包括:接收模块,用于接收客户端发送的翻译请求,其中,所述翻译请求包括待翻译内容和目标语言类型;第一获取模块,用于获取所述客户端的当前位置信...
【专利技术属性】
技术研发人员:王海峰,赵世奇,吴华,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。