一种多语种混合检索方法和系统技术方案

技术编号：9535332 阅读：101 留言：0更新日期：2014-01-03 18:39

本发明专利技术提供了一种多语种混合检索方法和系统，涉及网络技术领域。本发明专利技术的方法包括：接收用户端输入的查询词，并识别所述查询词的所属源语种；将所述查询词从源语种翻译为各目标语种的查询词；所述各目标语种为与所述源语种不同的语种；对于每个语种的查询词，基于所述查询词检索对应各语种网页信息的索引，获得相应语种的网页信息；对于由各目标语种对应的索引获得的网页信息，获取从各目标语种翻译为源语种后的网页信息；对于得到的所有网页信息，返回至少一条网页信息至用户端。本发明专利技术去除了现有技术对于在检索过程中全文翻译的依赖，降低因翻译而存在的信息损失问题，降低没有明显上下文关系的信息的翻译信息损失问题，提高搜索结果的精确度。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术提供了一种多语种混合检索方法和系统，涉及网络
。本专利技术的方法包括：接收用户端输入的查询词，并识别所述查询词的所属源语种；将所述查询词从源语种翻译为各目标语种的查询词；所述各目标语种为与所述源语种不同的语种；对于每个语种的查询词，基于所述查询词检索对应各语种网页信息的索引，获得相应语种的网页信息；对于由各目标语种对应的索引获得的网页信息，获取从各目标语种翻译为源语种后的网页信息；对于得到的所有网页信息，返回至少一条网页信息至用户端。本专利技术去除了现有技术对于在检索过程中全文翻译的依赖，降低因翻译而存在的信息损失问题，降低没有明显上下文关系的信息的翻译信息损失问题，提高搜索结果的精确度。【专利说明】一种多语种混合检索方法和系统
本申请涉及网络
，特别是涉及一种多语种混合检索方法和系统。
技术介绍
随着网络的普及，网络上的信息资源日益丰富且用户对于网络资源的需求也在逐渐提高。但是在网页信息资源日益丰富的同时，又存在着阻碍这些资源为用户所广泛共存的一个主要障碍:多语种问题。为了解决多语种问题，便开始多语种信息检索(MLIR)的研究。现有技术中，举例来说，以西班牙语和英语为例:首先，将英语的文档全文翻译为西班牙语文档，然后将翻译得到的西班牙语文档和原有的西班牙文档一起建立西班牙语对应的索引；同时也讲西班牙语文档全文翻译为英语文档，然后将翻译得到的英语文档和原有的英语文档一起建立英语对应的索引。当有英语查询词时，将英语查询词在英语对应的索引中进行检索，获取检索结果并返回；当有西班牙查询词时，将西班牙语查询词在西班...
一种多语种混合检索方法和系统

【技术保护点】
一种多语种混合检索方法，其特征在于，包括：接收用户端输入的查询词，并识别所述查询词的所属源语种；将所述查询词从源语种翻译为各目标语种的查询词；所述各目标语种为与所述源语种不同的语种；对于每个语种的查询词，基于所述查询词检索对应各语种网页信息的索引，获得相应语种的网页信息；对于由各目标语种对应的索引获得的网页信息，获取从各目标语种翻译为源语种后的网页信息；对于得到的所有网页信息，返回至少一条网页信息至用户端。

【技术特征摘要】

【专利技术属性】
技术研发人员：郑伟，林锋，金华兴，孙丽，刘清富，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人