一种跨语言搜索方法和装置、一种用于跨语言搜索的装置制造方法及图纸

技术编号:18398687 阅读:23 留言:0更新日期:2018-07-08 19:26
本发明专利技术实施例提供了一种跨语言搜索方法和装置、一种用于跨语言搜索的装置,其中的方法具体包括:将源语言搜索词翻译为目标语言搜索词;针对所述目标语言搜索词,获取其对应的目标语言搜索结果和翻译搜索结果;其中,所述翻译搜索结果为对所述目标语言搜索结果进行翻译得到;从所述翻译搜索结果中获取与所述目标语言搜索词相匹配的关键词;将所述翻译搜索结果中的所述关键词替换为所述源语言搜索词。本发明专利技术实施例可以提高翻译搜索结果的准确率、以及翻译搜索结果与目标语言搜索结果之间的一致性,且可以提高翻译搜索结果对于用户的吸引力,从而可以进一步提高翻译搜索结果的点击率。

【技术实现步骤摘要】
一种跨语言搜索方法和装置、一种用于跨语言搜索的装置
本专利技术涉及信息搜索
,特别是涉及一种跨语言搜索方法和装置、一种用于跨语言搜索的装置。
技术介绍
随着互联网信息的不断增长,用户对于信息搜索提出了更高的要求,不再满足于在同一种语种数据库中搜索,而要求获取多种语种数据。例如,如果用户输入的搜索词(query)为“蔻驰”,则中文数据库中的搜索可能并不能最大程度地满足用户需求,源自欧美网站的英文数据库中可能具有更优、更多的搜索结果。跨语言搜索技术结合了信息检索技术和机器翻译技术。现有的跨语言搜索过程具体可以包括:首先,通过机器翻译技术将源语言搜索词转换为目标语言搜索词;然后,依据源语言搜索词在对应的数据库中进行信息检索,得到第一搜索结果,以及,依据目标语言搜索词在对应的数据库中进行信息检索,得到第二搜索结果;接着,对第二搜索结果进行目标语言到源语言的翻译,以得到翻译搜索结果。在实际应用中,翻译质量等因素使得翻译搜索结果中难免存在错误,而错误的翻译搜索结果有可能会使得用户认为返回了与源语言搜索词无关的搜索结果,从而降低了翻译搜索结果的点击率。例如,用户输入的源语言搜索词为“蔻驰”,假设将该源语言搜索词“蔻驰”翻译为目标搜索词“coach”、并检索到目标搜索词“coach”对应的第二搜索结果“COACH–Shoes,Bags,Watches”,由于“coach”对应的翻译结果包括“教练”,故第二搜索结果“COACH–Shoes,Bags,Watches”可能被翻译为“教练–鞋子,袋子,手表”并被返回给用户;此种情况下,即使翻译搜索结果的具体内容(如网页内容)与源语言搜索词相关,错误的翻译搜索结果也有可能会使得用户认为该翻译搜索结果与源语言搜索词无关进而忽略该翻译搜索结果,从而降低了翻译搜索结果的点击率。
技术实现思路
鉴于上述问题,提出了本专利技术实施例以便提供一种克服上述问题或者至少部分地解决上述问题的跨语言搜索方法、跨语言搜索装置及用于跨语言搜索的装置,本专利技术实施例可以提高翻译搜索结果的准确率、以及翻译搜索结果与目标语言搜索结果之间的一致性,且可以提高翻译搜索结果对于用户的吸引力,从而可以进一步提高翻译搜索结果的点击率。为了解决上述问题,本专利技术实施例公开了一种跨语言搜索方法,包括:将源语言搜索词翻译为目标语言搜索词;针对所述目标语言搜索词,获取其对应的目标语言搜索结果和翻译搜索结果;其中,所述翻译搜索结果为对所述目标语言搜索结果进行翻译得到;从所述翻译搜索结果中获取与所述目标语言搜索词相匹配的关键词;将所述翻译搜索结果中的所述关键词替换为所述源语言搜索词。另一方面,本专利技术实施例公开了一种跨语言搜索装置,包括:搜索词翻译模块,用于将源语言搜索词翻译为目标语言搜索词;搜索结果获取模块,用于针对所述目标语言搜索词,获取其对应的目标语言搜索结果和翻译搜索结果;其中,所述翻译搜索结果为对所述目标语言搜索结果进行翻译得到;关键词获取模块,用于从所述翻译搜索结果中获取与所述目标语言搜索词相匹配的关键词;以及关键词替换模块,用于将所述翻译搜索结果中的所述关键词替换为所述源语言搜索词。可选地,所述关键词获取模块包括:映射建立子模块,用于建立所述目标语言搜索结果中包括的目标语言词汇与所述翻译搜索结果包括的源语言词汇之间的映射关系;映射查找子模块,用于依据所述目标语言搜索词,在所述映射关系中进行查找,以得到所述翻译搜索结果包括的、与所述目标语言搜索词相匹配的关键词。可选地,所述装置还包括:判断模块,用于在所述关键词获取模块从所述翻译搜索结果中获取与所述目标语言搜索词相匹配的关键词之前,判断所述翻译搜索结果是否包括所述源语言搜索词,若否,则触发所述关键词获取模块从所述翻译搜索结果中获取与所述目标语言搜索词相匹配的关键词。可选地,所述关键词替换模块,具体用于若所述关键词与所述源语言搜索词之间的匹配度符合第一预置匹配度条件,则将所述翻译搜索结果中的所述关键词替换为所述源语言搜索词。可选地,所述装置还包括:第一标记显示模块,用于若所述关键词与所述源语言搜索词之间的匹配度符合第二预置匹配度条件,则对所述翻译搜索结果中的所述关键词进行标记显示。可选地,所述第一标记显示模块,具体用于若所述翻译搜索结果不包括所述源语言搜索词、且所述关键词与所述源语言搜索词之间的匹配度符合第二预置匹配度条件,则对所述翻译搜索结果中的所述关键词进行标记显示。可选地,所述装置还包括:第二标记显示模块,用于若所述翻译搜索结果包括所述源语言搜索词,则对所述翻译搜索结果中的所述源语言关键词进行标记显示。再一方面,本专利技术实施例公开了一种用于跨语言搜索的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:将源语言搜索词翻译为目标语言搜索词;针对所述目标语言搜索词,获取其对应的目标语言搜索结果和翻译搜索结果;其中,所述翻译搜索结果为对所述目标语言搜索结果进行翻译得到;从所述翻译搜索结果中获取与所述目标语言搜索词相匹配的关键词;将所述翻译搜索结果中的所述关键词替换为所述源语言搜索词。又一方面,本专利技术实施例公开了一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行前述一个或多个所述的跨语言搜索方法。本专利技术实施例包括以下优点:本专利技术实施例从翻译搜索结果中获取与目标语言搜索词相匹配的关键词,并将所述翻译搜索结果中的所述关键词替换为源语言搜索词,可以在目标语言搜索结果到翻译搜索结果的翻译过程中出现目标语言搜索词对应的翻译错误的情况下,将该目标语言搜索词对应的翻译结果纠正为源语言搜索词,这样可以提高翻译搜索结果的准确率、以及翻译搜索结果与目标语言搜索结果之间的一致性,且可以提高翻译搜索结果对于用户的吸引力,从而可以进一步提高翻译搜索结果的点击率。附图说明图1是本专利技术的一种跨语言搜索方法的应用环境的示意图;图2是本专利技术的一种跨语言搜索方法实施例一的步骤流程图;图3是本专利技术的一种跨语言搜索方法实施例二的步骤流程图;图4是本专利技术的一种跨语言搜索方法实施例三的步骤流程图;图5是本专利技术的一种跨语言搜索方法实施例四的步骤流程图;图6是本专利技术的一种跨语言搜索方法实施例五的步骤流程图;图7是本专利技术的一种跨语言搜索装置实施例的结构框图;图8是本专利技术的一种用于跨语言搜索的装置900作为终端时的框图;及图9是本专利技术的一种用于跨语言搜索的装置作为服务器时的结构示意图。具体实施方式为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。专利技术人在实施本专利技术实施例的过程中发现,在跨语言搜索的过程中,在将源语言搜索词(以中文为例)对应的目标语言搜索词(以英文为例)再重新翻译为源语言的情况下,该目标语言搜索词通常对应至少一种翻译可能,这样将可能导致目标语言搜索结果到翻译搜索结果的翻译过程中出现翻译错误,然而错误的翻译搜索结果可能会使得用户认为该翻译搜索结果与源语言搜索词无关进而忽略该翻译搜索结果,从而降低了翻译搜索结果的点击率。本专利技术实施例提供了一种跨语言搜索方案,该方案可以将源语言搜索词翻译为目标语言搜索词;针本文档来自技高网
...

【技术保护点】
1.一种跨语言搜索方法,其特征在于,包括:将源语言搜索词翻译为目标语言搜索词;针对所述目标语言搜索词,获取其对应的目标语言搜索结果和翻译搜索结果;其中,所述翻译搜索结果为对所述目标语言搜索结果进行翻译得到;从所述翻译搜索结果中获取与所述目标语言搜索词相匹配的关键词;将所述翻译搜索结果中的所述关键词替换为所述源语言搜索词。

【技术特征摘要】
1.一种跨语言搜索方法,其特征在于,包括:将源语言搜索词翻译为目标语言搜索词;针对所述目标语言搜索词,获取其对应的目标语言搜索结果和翻译搜索结果;其中,所述翻译搜索结果为对所述目标语言搜索结果进行翻译得到;从所述翻译搜索结果中获取与所述目标语言搜索词相匹配的关键词;将所述翻译搜索结果中的所述关键词替换为所述源语言搜索词。2.根据权利要求1所述的方法,其特征在于,所述从所述翻译搜索结果中获取与所述目标语言搜索词相匹配的关键词,包括:建立所述目标语言搜索结果中包括的目标语言词汇与所述翻译搜索结果包括的源语言词汇之间的映射关系;依据所述目标语言搜索词,在所述映射关系中进行查找,以得到所述翻译搜索结果包括的、与所述目标语言搜索词相匹配的关键词。3.根据权利要求1或2所述的方法,其特征在于,在所述从所述翻译搜索结果中获取与所述目标语言搜索词相匹配的关键词之前,所述方法还包括:判断所述翻译搜索结果是否包括所述源语言搜索词;若所述翻译搜索结果不包括所述源语言搜索词,则执行所述从所述翻译搜索结果中获取与所述目标语言搜索词相匹配的关键词的步骤。4.根据权利要求1或2所述的方法,其特征在于,所述将所述翻译搜索结果中的所述关键词替换为所述源语言搜索词,包括:若所述关键词与所述源语言搜索词之间的匹配度符合第一预置匹配度条件,则将所述翻译搜索结果中的所述关键词替换为所述源语言搜索词。5.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:若所述关键词与所述源语言搜索词之间的匹配度符合第二预置匹配度条件,则对所述翻译搜索结果中的所述关键词进行标记显示。6.根据权利要求5所述的方法,其特征在于,所述对...

【专利技术属性】
技术研发人员:许静芳刘洋张嘉成翟飞飞戴磊刘祺方菲丁彦卓
申请(专利权)人:北京搜狗科技发展有限公司清华大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1