检索结果重排序系统及其方法技术方案

技术编号：8563065 阅读：233 留言：0更新日期：2013-04-11 04:45

本发明专利技术公开了一种检索结果重排序系统及重排序方法。该系统包括相关拾取模块、词序列提取模块、显著词序列判别模块、检索结果集、词序列集和重新计算相似度排序模块；其中，相关拾取模块显示原始检索结果，并由用户选择相关的记录，词序列提取模块提取每项记录的词序列，显著词序列判别模块根据相关与不相关两类记录的差别挖掘用于分类的显著词序列，重新计算相似度排序模块基于显著词序列对每项记录分别计算相似度，并依据相似度的值对检索结果的记录重新排序。本发明专利技术能够将用户真实期望得到的检索结果记录排在靠前的位置，节省用户的查询时间。用户可以准确快速地得到所期望的信息，从而提高对检索结果的满意程度。

全部详细技术资料下载

【技术实现步骤摘要】
检索结果重排序系统及其方法
本专利技术涉及一种对搜索引擎的检索结果进行重新排序的系统，同时也涉及该系统对检索结果进行重新排序的方法，属于网络搜索

技术介绍
当前，互联网中的数据总量以几百兆兆字节来计算，而且仍然呈指数增长。为了帮助用户从这个漫无边际的数据海洋中快速获取所需的信息，搜索引擎发挥着不可替代的作用。由于互联网信息是极其浩繁的，任何一个关键词都可能搜索到数百个甚至数万个相关的网页或者链接，而用户的时间和精力都是有限的，他往往只会关注排在前面的搜索结果，对排在后面的相关链接视而不见。因此，针对人们的这一使用习惯，有必要让搜索引擎有选择地安排搜索结果的排列顺序。对检索结果进行重新排序是搜索引擎优化检索结果、提高用户体验的有效技术手段，其利用缩小的检索结果集，通过与用户不同层次的交互，重新确定（估计）用户检索的焦点，可以帮助用户更快找到满意的检索结果。目前，已有很多对检索结果重新排序的技术方案，例如清华大学在专利号为ZL200710099594.6的中国专利技术专利中，提出了一种基于用户行为信息的搜索引擎检索结果重排序方法，利用用户历史查询点击的行为信...
检索结果重排序系统及其方法

【技术保护点】
一种检索结果重排序系统，其特征在于：所述检索结果重排序系统包括相关拾取模块、词序列提取模块、显著词序列判别模块、检索结果集、词序列集和重新计算相似度排序模块；其中，所述相关拾取模块与所述检索结果集连接，所述词序列提取模块分别连接所述检索结果集、所述词序列集、所述相关拾取模块和所述显著词序列判别模块，所述显著词序列判别模块分别连接所述词序列集和所述重新计算相似度排序模块；所述相关拾取模块显示原始检索结果，并由用户选择相关的记录，所述词序列提取模块提取每项记录的词序列，所述显著词序列判别模块根据相关与不相关两类记录的差别挖掘用于分类的显著词序列，所述重新计算相似度排序模块基于所述显著词序列对每项记...

【技术特征摘要】
1.一种检索结果重排序系统，其特征在于包括相关拾取模块、词序列提取模块、显著词序列判别模块、检索结果集、词序列集和重新计算相似度排序模块；其中，所述相关拾取模块与所述检索结果集连接，所述词序列提取模块分别连接所述检索结果集、所述词序列集、所述相关拾取模块和所述显著词序列判别模块，所述显著词序列判别模块分别连接所述词序列集和所述重新计算相似度排序模块；所述相关拾取模块显示来自不同通用搜索引擎的原始检索结果，并由用户选择相关记录，所述词序列提取模块提取每项记录的词序列，所述显著词序列判别模块根据相关与不相关两类记录的差别挖掘用于分类的显著词序列，通过再次训练得到用户选择的相关记录的显著词序列，所述重新计算相似度排序模块基于所述显著词序列对每项记录分别计算相似度，并依据所述相似度的值对原始检索结果的记录重新排序。2.如权利要求1所述的检索结果重排序系统，其特征在于：所述词序列提取模块对每项记录的文本进行分词处理，得到有确切语义的词汇，并将停用词过滤，以句子为单位保存每项记录的词序列。3.如权利要求1或2所述的检索结果重排序系统，其特征在于：所述词序列保存在所述词序列集中。4...

【专利技术属性】
技术研发人员：王东胜，宋传宝，王树强，
申请(专利权)人：北京海量融通软件技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人