针对多义项词条的搜索方法及装置制造方法及图纸

技术编号:15297711 阅读:82 留言:0更新日期:2017-05-11 20:21
本发明专利技术提供了一种针对多义项词条的搜索方法及装置。所述方法包括:接收到以多义项词条作为搜索关键词进行搜索的搜索请求;根据所述搜索请求进行搜索,获得所述多义项词条对应的搜索结果;获取所述多义项词条对应的搜索推荐数据,并将所述搜索推荐数据与所述多义项词条的各不同含义分别进行匹配,得到所述搜索推荐数据与所述各不同含义之间的相似度;根据所述相似度确定所述多义项词条在本次搜索中的主义项;从所述搜索结果中筛选出与所述主义项对应的子搜索结果,并将与所述主义项对应的子搜索结果显示在搜索结果页面。该技术方案使得搜索引擎能够为用户提供多义项词条在本次搜索中的主义项对应的子搜索结果项,提高用户对搜索引擎的使用体验。

Search method and device for polysemous term

The invention provides a method and a device for searching a term of a polysemous item. The method includes: receiving the polysemous entries as search keywords to search the search request; according to the search request to search, obtain the polysemous entries corresponding to the search results; obtaining the polysemous entries corresponding to the search and recommendation data, the different meanings of the search and the recommended data polysemous entries are matched to obtain the similarity between recommended search data and the different meanings; according to the similarity of the polysemous entries identified in this search in principle; from the search results were screened with the doctrine of a corresponding sub search results, and with the doctrine of a corresponding sub search results are displayed in the search results page. The technical scheme enables the search engine to provide the user with the sub search result item corresponding to the term of the polysemous item in the search.

【技术实现步骤摘要】

本专利技术涉及互联网
,特别是涉及一种针对多义项词条的搜索方法及装置
技术介绍
百科词条中存在许多具有多种不同含义的词条,这种词条可称之为多义项词条。例如,词条“刘晓华”具有多种不同的含义,其中最知名的就是大家熟知的香港男演员、歌手,但该词条还存在其他的含义,如XX大学一个教授的姓名也是“刘晓华”,另外还有一本书的名称也叫“刘晓华”,等等。因此,词条“刘晓华”至少具有歌手演员、XX大学教授、书籍这三个含义,词条“刘晓华”是一个多义项词条。用户在百科或其他搜索引擎中搜索上述类型的多义项词条时,应该向用户提供哪个含义的多义项词条是个问题。仍以上述的多义项词条“刘晓华”为例,假设用户想要搜索名称为“刘晓华”的书籍,如果搜索引擎向用户提供的是歌手演员“刘晓华”对应的搜索结果,就会导致用户无法获取到想要查看的内容,或者需要在大量搜索结果中手动查找名称为“刘晓华”的书籍对应的搜索结果,从而浪费用户大量的时间和精力,使用搜索引擎的体验度也较低。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的针对多义项词条的搜索方法及装置。依据本专利技术的一个方面,提供了一种针对多义项词条的搜索方法,包括:接收到以多义项词条作为搜索关键词进行搜索的搜索请求,所述多义项词条指具有多种不同含义的同一词条;根据所述搜索请求进行搜索,获得所述多义项词条对应的搜索结果,所述搜索结果包括基于所述多义项词条的各不同含义搜索时分别对应的子搜索结果;获取所述多义项词条对应的搜索推荐数据,并将所述搜索推荐数据与所述多义项词条的各不同含义分别进行匹配,得到所述搜索推荐数据与所述各不同含义之间的相似度;根据所述相似度确定所述多义项词条在本次搜索中的主义项;从所述搜索结果中筛选出与所述主义项对应的子搜索结果,并将与所述主义项对应的子搜索结果显示在搜索结果页面。可选地,所述搜索推荐数据包括以下至少一项:历史搜索数据;热点搜索数据。可选地,获取所述多义项词条对应的搜索推荐数据,包括:获取对所述多义项词条进行搜索时搜索框的下拉列表中的相关搜索数据;将所述下拉列表中的相关搜索数据确定为所述多义项词条对应的搜索推荐数据。可选地,将所述搜索推荐数据与所述多义项词条的各不同含义分别进行匹配,得到所述搜索推荐数据与所述各不同含义之间的相似度,包括:获取所述搜索推荐数据中除所述多义项词条之外的多元素所组成的元素集合;分别计算所述元素集合和所述各含义之间的相似度;确定所述元素集合和所述各含义之间的相似度为所述搜索推荐数据与所述各含义之间的相似度。可选地,分别计算所述元素集合和所述各含义之间的相似度,包括:统计所述各含义对应的子搜索结果中包含所述多元素的数目;根据所述数目计算所述元素集合和所述各含义之间的相似度,其中,所述相似度与所述子搜索结果中包含所述多元素的数目成正比。可选地,根据所述相似度确定所述多义项词条在本次搜索中的主义项,包括:选择与所述搜索推荐数据之间相似度最高的含义;将具备该含义的多义项词条确定为所述多义项词条在本次搜索中的主义项。可选地,根据所述相似度确定所述多义项词条在本次搜索中的主义项,包括:统计针对所述多义项词条进行搜索的各历史搜索结果对应的访问率;结合所述相似度以及所述访问率确定所述多义项词条在本次搜索中的主义项。可选地,结合所述相似度以及所述访问率确定所述多义项词条在本次搜索中的主义项,包括:根据所述相似度确定所述多义项词条的至少两个备选含义;筛选出所述访问率最高的历史搜索结果;确定所述访问率最高的历史搜索结果与各备选含义之间的匹配度;选择所述匹配度最高值对应的备选含义,并确定具备该备选含义的多义项词条为所述多义项词条在本次搜索中的主义项。依据本专利技术的另一个方面,提供了一种针对多义项词条的搜索装置,包括:接收模块,适于接收到以多义项词条作为搜索关键词进行搜索的搜索请求,所述多义项词条指具有多种不同含义的同一词条;搜索模块,适于根据所述搜索请求进行搜索,获得所述多义项词条对应的搜索结果,所述搜索结果包括基于所述多义项词条的各不同含义搜索时分别对应的子搜索结果;匹配模块,适于获取所述多义项词条对应的搜索推荐数据,并将所述搜索推荐数据与所述多义项词条的各不同含义分别进行匹配,得到所述搜索推荐数据与所述各不同含义之间的相似度;确定模块,适于根据所述相似度确定所述多义项词条在本次搜索中的主义项;显示模块,适于从所述搜索结果中筛选出与所述主义项对应的子搜索结果,并将与所述主义项对应的子搜索结果显示在搜索结果页面。可选地,所述搜索推荐数据包括以下至少一项:历史搜索数据;热点搜索数据。可选地,所述匹配模块还适于:获取对所述多义项词条进行搜索时搜索框的下拉列表中的相关搜索数据;将所述下拉列表中的相关搜索数据确定为所述多义项词条对应的搜索推荐数据。可选地,所述匹配模块还适于:获取所述搜索推荐数据中除所述多义项词条之外的多元素所组成的元素集合;分别计算所述元素集合和所述各含义之间的相似度;确定所述元素集合和所述各含义之间的相似度为所述搜索推荐数据与所述各含义之间的相似度。可选地,所述匹配模块还适于:统计所述各含义对应的子搜索结果中包含所述多元素的数目;根据所述数目计算所述元素集合和所述各含义之间的相似度,其中,所述相似度与所述子搜索结果中包含所述多元素的数目成正比。可选地,所述确定模块还适于:选择与所述搜索推荐数据之间相似度最高的含义;将具备该含义的多义项词条确定为所述多义项词条在本次搜索中的主义项。可选地,所述确定模块还适于:统计针对所述多义项词条进行搜索的各历史搜索结果对应的访问率;结合所述相似度以及所述访问率确定所述多义项词条在本次搜索中的主义项。可选地,所述确定模块还适于:根据所述相似度确定所述多义项词条的至少两个备选含义;筛选出所述访问率最高的历史搜索结果;确定所述访问率最高的历史搜索结果与各备选含义之间的匹配度;选择所述匹配度最高值对应的备选含义,并确定具备该备选含义的多义项词条为所述多义项词条在本次搜索中的主义项。采用本专利技术实施例提供的技术方案,能够在接收到以多义项词条为搜索关键词的搜索请求时,获取多义项词条对应的搜索推荐数据,并将搜索推荐数据与多义项词条的不同含义分别进行匹配,以得到搜索推荐数据与各不同含义之间的相似度,进而根据该相似度确定多义项词条在本次搜索中的主义项,使得在对多义项词条进行搜索时能够准确确定出其主义项,排除主义项之外的其他含义,避免因同一词条具有多个不同含义时无法准确进行搜索的情况。并且,该技术方案还能够从与多义项词条对应的搜索结果中筛选出与其主义项对应的子搜索结果,并将筛选出的子搜索结果显示在搜索结果页面,使得搜索引擎能够为用户提供多义项词条在本次搜索中的主义项对应的子搜索结果项,而并非提供多义项词条在多个不同含义下的所有搜索结果,因此无需用户在所有搜索结果中查找对自己有用的搜索结果,从而为用户节省大量时间。也并非提供多义项词条在除主义项之外的其他含义下的搜索结果,因此避免了为用户提供错误搜索结果的情况,提高用户对搜索引擎的使用体验。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够本文档来自技高网...
针对多义项词条的搜索方法及装置

【技术保护点】
一种针对多义项词条的搜索方法,包括:接收到以多义项词条作为搜索关键词进行搜索的搜索请求,所述多义项词条指具有多种不同含义的同一词条;根据所述搜索请求进行搜索,获得所述多义项词条对应的搜索结果,所述搜索结果包括基于所述多义项词条的各不同含义搜索时分别对应的子搜索结果;获取所述多义项词条对应的搜索推荐数据,并将所述搜索推荐数据与所述多义项词条的各不同含义分别进行匹配,得到所述搜索推荐数据与所述各不同含义之间的相似度;根据所述相似度确定所述多义项词条在本次搜索中的主义项;从所述搜索结果中筛选出与所述主义项对应的子搜索结果,并将与所述主义项对应的子搜索结果显示在搜索结果页面。

【技术特征摘要】
1.一种针对多义项词条的搜索方法,包括:接收到以多义项词条作为搜索关键词进行搜索的搜索请求,所述多义项词条指具有多种不同含义的同一词条;根据所述搜索请求进行搜索,获得所述多义项词条对应的搜索结果,所述搜索结果包括基于所述多义项词条的各不同含义搜索时分别对应的子搜索结果;获取所述多义项词条对应的搜索推荐数据,并将所述搜索推荐数据与所述多义项词条的各不同含义分别进行匹配,得到所述搜索推荐数据与所述各不同含义之间的相似度;根据所述相似度确定所述多义项词条在本次搜索中的主义项;从所述搜索结果中筛选出与所述主义项对应的子搜索结果,并将与所述主义项对应的子搜索结果显示在搜索结果页面。2.根据权利要求1所述的方法,其中,所述搜索推荐数据包括以下至少一项:历史搜索数据;热点搜索数据。3.根据权利要求1或2所述的方法,其中,获取所述多义项词条对应的搜索推荐数据,包括:获取对所述多义项词条进行搜索时搜索框的下拉列表中的相关搜索数据;将所述下拉列表中的相关搜索数据确定为所述多义项词条对应的搜索推荐数据。4.根据权利要求1-3中任一项所述的方法,其中,将所述搜索推荐数据与所述多义项词条的各不同含义分别进行匹配,得到所述搜索推荐数据与所述各不同含义之间的相似度,包括:获取所述搜索推荐数据中除所述多义项词条之外的多元素所组成的元素集合;分别计算所述元素集合和所述各含义之间的相似度;确定所述元素集合和所述各含义之间的相似度为所述搜索推荐数据与所述各含义之间的相似度。5.根据权利要求1-4中任一项所述的方法,其中,分别计算所述元素集合和所述各含义之间的相似度,包括:统计所述各含义对应的子搜索结果中包含所述多元素的数目;根据所述数目计算所述元素集合和所述各含义之间的相似度,其中,所述相似度与所述子搜索结果中包含所述多元素的数目成正比。6.根据权利要求1-5中...

【专利技术属性】
技术研发人员:王智广
申请(专利权)人:北京奇虎科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1