一种基于用户行为信息的检索结果实时更新方法及其系统技术方案

技术编号:8323604 阅读:175 留言:0更新日期:2013-02-14 01:45
本发明专利技术公开了一种基于用户行为信息的检索结果实时更新方法及系统,包括:获取包含至少一项条目的检索结果;获取用户行为信息;基于用户行为信息选择处理模式,并根据条目相似度,对检索结果中的条目进行处理;得到并显示更新后的检索结果。本发明专利技术基于用户行为信息实时改进检索结果,排序靠前的条目始终为用户需要且未被访问的条目,提高了用户查看检索结果的效率,改善了用户检索体验。

【技术实现步骤摘要】

本专利技术涉及信息搜索
,尤其涉及一种基于用户行为信息的检索结果实时更新方法及其系统
技术介绍
随着计算机及信息技术的快速发展,由计算机自动或辅助用户生成的信息越来越多,如何在海量信息中检索特定信息由此变得十分重要。为了解决此类问题,各种计算机信息检索技术应运而生,包括计算机文件检索系统、网络搜索引擎、在线数据库联机检索系统等。计算机用户利用这些系统通过键入关键词而查找所需信息,此类系统在很大程度上解决了用户检索信息的难题,但是缺乏精确检索的能力以及良好的用户体验。近年来机器学习技术发展迅速,它可利用人工智能相关技术模仿自然人行为和思考方式,对用户行为进行推断使计算机能达到交流目的。然而,此类技术尚未被广泛用于改进信息检索系统的用 户体验。现有技术中尚未见基于用户体验及反馈等用户行为信息的对检索结果进行重组及动态实时更新的技术。
技术实现思路
本专利技术提出了一种基于用户行为信息的检索结果实时更新方法,包括步骤一获取包含至少一项条目的检索结果;步骤二 获取用户行为信息;步骤三基于所述用户行为信息选择处理模式,并根据条目相似度,对所述检索结果中的条目进行处理;步骤四得到并显示更新后的检索结果。“各条目的相似度对比”是各条目之间、各条目的内容之间进行相似度的比较。相似度比较的算法包括计算两个集合的Jaccard指数的算法等。相似度用于表示各条目或者各条目的内容之间的相似程度。若相似度值越高,则代表该两个条目或者条目的内容中存在相同或相近似的信息越多。其中,所述步骤一中所述包含至少一项条目的检索结果的生成步骤包括步骤Al :获取关键词,对所述关键词进行预处理;步骤A2 :判断所述预处理后的关键词是否符合要求;若符合要求的,则根据所述关键词进行检索生成检索结果;若不符合要求的,则重新执行所述步骤Al、A2,直至生成检索结果。其中,所述步骤一中,根据权值将所述条目由高到低排序。其中,所述步骤一中,根据所述条目被引用次数将权值相同的条目由高到低排序。本专利技术中,所述用户行为信息是指对于所述检索结果中包含的各项条目,用户会产生不同的兴趣或关注,例如,可能会访问或点击某个/些条目的,可能会选择性访问某个/些条目,可能会跳过某个/些条目,对各条目的关注时间长短不一,等等,因不同需求或反应,用户作出的不同行为,从而形成相应的用户行为信息。所述用户行为信息包括用户历史访问条目、用户忽略条目、用户访问不同条目的时间间隔、用户历史访问条目的内容长度、用户历史访问条目的阅读时间长度、用户访问条目时的生理体征信息。还包括用户在访问条目时可能的其他反应信息。用户历史访问条目,是指用户在浏览检索结果的过程中,点选进入某一条目进行进一步访问,则该条目为用户历史访问条目。用户忽略条目,是指用户在跳跃性浏览检索结果的过程中,在访问某一条目之前仍然存在某些条目未被访问,则这些条目为用户忽略条目。用户访问不同条目的时间间隔,是指用户点选不同条目进行进一步访问的时间间隔。 用户历史访问条目的内容长度,是指用户进一步访问的这个条目的内容的信息量,包括该条目内的字数、视频播放的时间等信息。用户历史访问条目的阅读时间长度,是指用户点选后进一步访问一个条目直到访问完毕返回检索结果页面所花费的时间。用户访问条目时的生理体征信息,是指用户行为信息获取装置捕捉到的用户在阅读条目时的各种生理或者肢体特征参数及其变化信息。例如,用户在阅读条目时产生的面部表情、眼球运动、肢体特征、心率变化、呼吸变化、或可适用的其他生理体征信息。本专利技术进一步包括步骤五即,重复执行所述步骤二至步骤四,直到停止获取所述用户行为信息时终止。本专利技术中,所述步骤三,基于所述用户行为信息选择的所述检索结果包含的各项条目的处理模式包括隐藏历史访问条目、相似历史访问条目排序、或相似忽略条目排序。进一步地,本专利技术可以运用上述三种模式之任意一项进行处理,或运用其中的任意多项组合进行处理,例如,将已访问的条目加以隐藏,使其不显示在更新后的检索结果中。例如,将相似的已忽略的条目按降序排列,不再显示在更新后的检索结果中。例如,将相似的历史访问条目按升序排列显示在更新后的检索结果中。其中,所述隐藏历史访问条目包括以下步骤步骤Rl :基于所述用户行为信息选中用户已访问的条目;步骤B2 :将所述用户已访问的条目从所述检索结果中移出;步骤B3 :将所述已访问的条目存入历史访问条目集合中。本专利技术中,历史访问条目集合是指由已访问的条目组成。历史访问条目集合存储于所述条目处理装置中。其中,所述相似历史访问条目排序包括以下步骤步骤Cl :基于所述用户行为信息选中用户已访问的条目;步骤C2 :将所述历史访问条目存入所述历史访问条目集合中;步骤C3 :对所述历史访问条目集合中的条目进行相似度对比,获取所述条目之间的相似内容;步骤C4:根据所述相似内容对所述检索结果中的各条目进行相似度对比,生成所述各条目与所述相似内容的相似度值;步骤C5 :依据所述相似度值由高至低对所述检索结果中的各条目进行排序。所述条目之间的相似内容是指历史访问条目之间相似度最高的信息。例如,历史访问条目的摘要内容中均出现某一词汇ABC,根据相似度对比装置计算后认定该词汇ABC作为历史访问条目中相似度最高的内容,则该词汇ABC作为各个历史访问条目之间的相似内容。根据所述相似内容对所述检索结果中的各条目进行相似度对比,计算检索结果中的各条目与该相似内容的相似程度。相似度值越高,即相似程度越高,表明所述检索结果中的条目与用户历史访问条目越相似。进一步地,条目处理装置根据该相似度值对所述检索结果中的条目进行排序,使用户感兴趣的条目的排序靠前。其中,所述相似忽略条目排序包括以下步骤步骤Dl :基于所述用户行为信息选中用户在访问中忽略的条目;步骤D2 :将所述用户的忽略条目存入历史忽略条目集合中; 步骤D3 :将所述检索结果中的各条目与所述历史忽略条目集合中的各条目进行相似度对比,获取所述检索结果中各条目的相似性权值;步骤D4:依据所述相似性权值由低至高对所述检索结果中的各条目进行排序。本专利技术中,历史忽略条目集合是指由已忽略的条目组成。历史忽略条目集合存储于所述条目处理装置中。其中,进一步包括计算所述历史访问条目集合中的条目与所述相似内容的相似度值,将所述历史访问条目集合中的各条目按照所述相似度值由高到低排序。本专利技术还提出了一种基于用户行为信息的检索结果实时更新系统,包括用户行为信息获取装置,其获取用户行为信息;相似度对比装置,其包含计算相似度的功能模块;条目处理装置,其与所述用户行为信息获取装置以及相似度对比装置连接,用于根据所述用户行为信息获取装置获取的所述用户行为信息选择模式,并根据所述相似度对比装置对于所述条目的相似度对比结果,处理所述检索结果中的条目;显示装置,其与所述条目处理装置连接,接收并显示由所述条目处理装置发送的条目。本专利技术检索结果实时更新系统中,进一步包括数据库,其存储有海量信息;检索装置,其与所述数据库及所述条目处理装置连接,用于根据关键词检索所述海量信息生成所述检索结果。进一步地,所述检索装置生成所述检索结果中各条目与所述关键词的匹配度的权值。其中,用户行为信息获取装置包括鼠标、键盘、图像获取设备、计算机系统内置的计时设备、红外感应设备本文档来自技高网...

【技术保护点】
一种基于用户行为信息的检索结果实时更新方法,其特征在于,包括以下步骤:步骤一:获取包含至少一项条目的检索结果;步骤二:获取用户行为信息;步骤三:基于所述用户行为信息选择处理模式,并根据条目相似度,对所述检索结果中的条目进行处理;步骤四:得到并显示更新后的检索结果。

【技术特征摘要】
1.一种基于用户行为信息的检索结果实时更新方法,其特征在于,包括以下步骤 步骤一获取包含至少一项条目的检索结果; 步骤二 获取用户行为信息; 步骤三基于所述用户行为信息选择处理模式,并根据条目相似度,对所述检索结果中的条目进行处理; 步骤四得到并显示更新后的检索结果。2.如权利要求I所述的检索结果实时更新方法,其特征在于,所述步骤一中所述包含至少一项条目的检索结果是通过以下步骤获得 步骤Al :获取关键词,对所述关键词进行预处理; 步骤A2 :判断所述预处理后的关键词是否符合要求;若符合要求的,则根据所述关键词进行检索生成检索结果;若不符合要求的,则重新执行所述步骤Al、A2,直至生成检索结果O3.如权利要求I所述的检索结果实时更新方法,其特征在于,所述步骤一中,根据权值将所述条目由高到低排序。4.如权利要求3所述的检索结果实时更新方法,其特征在于,所述步骤一中,根据所述条目被引用次数将权值相同的所述条目由高到低排序。5.如权利要求I所述的检索结果实时更新方法,其特征在于,所述用户行为信息包括用户历史访问条目、用户忽略条目、用户访问不同条目的时间间隔、用户历史访问条目的内容长度、用户历史访问条目的阅读时间长度、用户访问条目时的生理体征信息。6.如权利要求I所述的检索结果实时更新方法,其特征在于,进一步包括步骤五重复执行所述步骤二至步骤四,直到停止获取所述用户行为信息时终止。7.如权利要求I所述的检索结果实时更新方法,其特征在于,所述步骤三的处理模式包括 隐藏历史访问条目模式、相似历史访问条目排序模式、或相似忽略条目排序模式中任意一项或多项。8.如权利要求7所述的检索结果实时更新方法,其特征在于,所述隐藏历史访问条目包括 步骤BI :基于所述用户行为信息选中用户已访问的条目; 步骤B2 :将所述用户历史访问条目从所述检索结果中移出; 步骤B3 :将所述已访问的条目存入历史访问条目集合中。9.如权利要求7所述的检索结果实时更新方法,其特征在于,所述相似历史访问条目排序包括 步骤Cl :基于所述用户行为信息选中用户已访问的条目; 步骤C2 :将所述历史访问条目存入所述历史访问条目集合中; 步骤C3 :对所述历史访问条目集合中...

【专利技术属性】
技术研发人员:李道远程鑫高俊顾鑫
申请(专利权)人:江苏外博资讯有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1