【技术实现步骤摘要】
一种基于快速检索算法的列表查询方法
[0001]本专利技术涉及信息检索
,具体涉及一种基于快速检索算法的列表查询方法。
技术介绍
[0002]随着互联网和数字化技术的快速发展,网络上积累了海量的各种信息,并且随着时间的增长,信息积累速度也逐渐增加,对信息的检索处理也成为挑战。倒排索引算法为一种高效处理大规模信息数据的方法,能够提供快速响应,因此得到了广泛的应用,现代搜索引擎的索引都是基于倒排索引。
[0003]在使用倒排索引算法进行检索时,每个单词都会生成一个倒排列表,倒排列表包含了每个出现该单词的文档信息记录,用户检索该单词时会呈现所有的相关文档信息进行查阅。但用户进行多单词组合查询时,由于多个列表进行组合排序,导致所期望的查阅内容可能排序靠后,用户检索时间长,难以搜索到想要查阅的内容,影响用户检索体验。
技术实现思路
[0004]为了解决上述通过倒排索引算法进行信息检索时,可能出现用户期望查询内容排序靠后,用户检索时间长的技术问题,本专利技术的目的在于提供一种基于快速检索算法的列表查询方法, ...
【技术保护点】
【技术特征摘要】
1.一种基于快速检索算法的列表查询方法,其特征在于,所述方法包括以下步骤:根据历史查询数据集获得单词的倒排列表;根据所述单词的倒排列表中,列表项内数据项的点击量的差异特征获得列表项的检索指数;根据列表项的检索频率特征和所述检索指数获得列表项的检索评分;根据所述单词的列表项与任意倒排列表的其他列表项之间的关联检索特征获得所述单词的列表项的关联系数;根据所述单词的列表项与任意倒排列表的其他列表项之间的关联检索频率特征获得所述单词的列表项的组合度;根据所述单词的列表项的所述关联系数和所述组合度获得所述单词的列表项的关联特征值;根据所述单词的列表项的所述关联特征值确定关联值范围;根据所述单词的列表项的所述检索评分和所述关联值范围获得列表项的期望值;根据单词的列表项的所述期望值优化检索内容的排序结果。2.根据权利要求1所述的一种基于快速检索算法的列表查询方法,其特征在于,所述根据历史查询数据集获得单词的倒排列表的步骤包括:所述历史查询数据集包括每次检索的单词、检索查询结果和结果点击次数;根据查询的单词通过倒排索引算法构建所述单词的所述倒排列表。3.根据权利要求2所述的一种基于快速检索算法的列表查询方法,其特征在于,所述根据所述单词的倒排列表中,列表项内数据项的点击量的差异特征获得列表项的检索指数的步骤包括:对于单词的任意列表项,计算所述任意列表项内所有被点击的数据项的所述结果点击次数的平均值,获得数据项的点击量均值;计算所述任意列表项内的数据项的所述结果点击次数的最大值和所述点击量均值的差值,获得点击量差异值,计算所述点击量差异值与预设极小正数的和值,获得点击量差异值表征值;计算所述点击量均值与所述点击量差异值表征值的比值并正相关映射,获得单词的所述任意列表项的检索指数。4.根据权利要求3所述的一种基于快速检索算法的列表查询方法,其特征在于,所述根据列表项的检索频率特征和所述检索指数获得列表项的检索评分的步骤包括:计算单词的所述任意列表项在所有检索查询结果中出现的次数,获得所述任意列表项的检索频率值;计算所述检索频率值与所述检索指数的乘积并归一化,获得单词的所述任意列表项的所述检索评分。5.根据权利要求4所述的一种基于快速检索算法的列表查询方法,其特征在于,所述根据所述单词的列表项与任意倒排列表的其他列表项之间的关联检索特征获得所述单词的列表项的关联系数的步骤包括:计算所述单词的任意列表项与任意倒排列表的其他列表项出现在相同的检索查询结果中并且点击所述任意列表项的次数,获得所述单词的任意列表项与其他列表项的相关次数;计算所述相关次数与总结果点击次数的比值,获得所述单词的任意列表项与其他列表项的相关检索占比;计算所述相关次数与所述检索频率值...
【专利技术属性】
技术研发人员:沈志,张智,
申请(专利权)人:湖南立人科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。