一种基于知识库的查询分面生成方法技术

技术编号：13244403 阅读：41 留言：0更新日期：2016-05-15 04:47

本发明专利技术公开了一种基于知识库的查询分面生成方法，该方法包括如下步骤：1)对于给定查询q，从搜索引擎中获取前T个检索结果，组成查询结果集合D；2)基于QDMiner算法获取一系列初始查询分面f，一系列所述初始查询分面f组成集合F；3)对每一个所述初始查询分面f进行扩展；4)对扩展后的所述初始查询分面f利用检索文档进行过滤，以保证扩展结果的准确率；利用扩展之后的初始查询分面f生成最终的查询分面。本发明专利技术使用知识库生成查询分面，可以有效解决现有方法依赖于检索结果的局限性。通过利用知识库中高质量的信息对初始分面进行扩展，检索结果中没有出现或未被抽取的分面词项可以被准确定位，从而提高查询分面的准确性和覆盖率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及。
技术介绍
据中国互联网络信息中心(CNNIC)发布的《2013年中国网民搜索行为研究报告》显示，截至2013年6月底，中国搜索引擎网民规模为4.70亿，中国手机搜索网民数达3.24亿。在过去半年中使用过综合搜索引擎的网民比例达98%，可见，在互联网时代，搜索引擎是人们进入网络的主要入口，是获取网络信息的主要来源。目前综合搜索引擎主要以相关文档列表的形式展示搜索结果，并按照文档的相关性由高到低排序，对于简单的、导航性的搜素，如搜索"淘宝官网"，这种方式能够满足需求，但对于复杂的、信息丰富的、探索式的搜索，这种展现形式就显得过于单薄，用户需要在返回的成千上万的结果中寻找、总结所需的信息，效率底下。某些情况下，用户的搜索意图是模糊的，很难准确地通过一两个词表达，例如搜索相关领域的知识等；另外，用户的搜索是可能是探索式的，需要搜索引擎分门别类地组织好相关内容，方便用户一步一步找到自己想要的信息，例如购物网站中的搜索会对商品的品牌、样式、大小等给出对应的限制。对于前者，目前的主要做法是搜索建议，用户在搜索框输入内容时，搜索引擎会根据以往积累的搜索日志提示用户可能的搜索语句;对于后一种情况，目前应用的范围主要是商品、酒店等垂直领域。对于上面问题，查询分面是一个有效的解决途径。查询分面可以看作是对查询从不同角度做出的总结和归纳，例如查询"王菲"的分面有:她的著名歌曲、专辑、好友、获得的奖项等。查询分面是对用户查询意图的扩展，是对潜在的查询信息的总结，不仅可以方便用户明确搜索意图，还能提示用户相关内容，以便用户...

【技术保护点】
一种基于知识库的查询分面生成方法，其特征在于，所述方法包括如下步骤：1)对于给定查询q，从搜索引擎中获取前T个检索结果，组成查询结果集合D；2)基于QDMiner算法获取一系列初始查询分面f，一系列所述初始查询分面f组成集合F；3)对每一个所述初始查询分面f进行扩展；4)对扩展后的所述初始查询分面f利用检索文档进行过滤，以保证扩展结果的准确率；利用扩展之后的初始查询分面f生成最终的查询分面。

【技术特征摘要】

【专利技术属性】
技术研发人员：窦志成，文继荣，江政宝，
申请(专利权)人：中国人民大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人