一种信息搜索的方法和装置制造方法及图纸

技术编号:7974899 阅读:134 留言:0更新日期:2012-11-15 23:02
本发明专利技术提供了一种信息搜索的方法和系统,所述方法包括:接收用户输入的搜索关键词;搜索与所述关键词相匹配的网页,得到搜索结果;在基础排序的基础上,基于用户针对所匹配网页的个性化反馈信息,对所述搜索结果进行排序;依据排序结果,对所述搜索结果进行展现。本发明专利技术的信息搜索方法,在现有的各种搜索排序方案的基础上,引入了用户针对网页的个性化反馈信息,以优化现有的搜索排序方案。由于所述个性化反馈信息能够在一定程度上反映用户对网页的关注度以及用户对该网页浏览后的反馈信息等等,因此,本发明专利技术能够提高对网页搜索排序的准确度,使得搜索结果排序更加接近于用户的真实搜索需求。

【技术实现步骤摘要】

本专利技术涉及互联网搜索
,特别是涉及一种信息搜索的方法和装置
技术介绍
目前,大规模网络数据搜索,已经成为互联网最主要的应用之一。以典型的网页搜索为例,其通常利用内部的搜索机器人蜘蛛(Spider)程序,自动搜索互联网上大大小小的网站内容,按照网页相关性原理在每一个关键词和所有相关的网页之间建立一个对应关系,储存在其网络服务器的数据库中;用户只要输入关键词就可以找到符合该关键词特征的所有被搜索的网页,并且以超级链接的方式对搜索结果列表排序展示,并有简单介绍,点击相应的链接就可以进入相应的网络资源网站,从而找到所需信肩、O 上述搜索到的结果通常数以百万计,但是相关性越高的信息,在搜索结果列表位置中的位置越靠前。例如,谷歌会通过网页与关键词之间的若干相关性指标,计算出每个网页的得分;当用户在搜索窗口输入某个关键词的时候,会依据各自得分对含有这个关键词的所有网页进行排序,分高者排在前面。搜索引擎能够给用户带来了很大的便利,避免了陷入数据的海洋。但同时由于各种搜索引擎的排序方案,往往具有自己的局限,在排序靠前的网页中可能存在用户并不需要的网页(如竞价排名方式等),而排序靠后的网页可能恰恰是用户所需要的。即现有的各种搜索引擎的排序方案仍然存在需要改进的地方。总之,需要本领域技术人员迫切解决的一个技术问题就是如何能够改善现有的搜索排序方案,提供给用户更为精准的搜索结果。
技术实现思路
本专利技术所要解决的技术问题是提供一种信息搜索的方法和装置,能够针对网页实现有效的搜索排序,改善现有的搜索排序方案,提高对网页搜索的准确度,使得排序在前的搜索结果页面更加接近于用户的真实搜索需求。为了解决上述问题,本专利技术公开了一种信息搜索的方法,包括接收用户输入的搜索关键词;搜索与所述关键词相匹配的网页,得到搜索结果;在基础排序的基础上,基于用户针对所匹配网页的个性化反馈信息,对所述搜索结果进行排序;依据排序结果,对所述搜索结果进行展现。优选的,所述用户针对所匹配网页的个性化反馈信息的收集过程,包括由独立于网页之外的应用程序接收用户发送的针对网页的个性化反馈信息;以及,将所述个性化反馈信息和对应的网页标识保存至服务器,所述服务器存储有多个不同域名下的网页的网页标识和个性化反馈信息。优选的,所述在基础排序的基础上,基于用户针对所匹配网页的个性化反馈信息,对所述搜索结果进行排序的步骤,可以包括通过基础排序方案得到所匹配网页的基础排序参数;基于用户针对所匹配网页的个性化反馈信息,得到各网页的辅助排序参数;对各网页的基础排序参数和辅助排序参数进行加权平均;依据各网页的加权平均结果,对所述搜索结果进行排序。优选的,所述在基础排序的基础上,基于用户针对所匹配网页的个性化反馈信息,对所述搜索结果进行排序的步骤,可以包括通过基础排序方案得到所匹配网页的基础排序参数;基于用户针对所匹配网页的个性化反馈信息,得到各网页的辅助排序参数;当搜索结果中两个或多个网页的基础排序参数的差值或者距离在一定阈值范围内时,依据所述两个或多个网页的辅助排序参数,对其排序位置进行调整。优选的,所述在基础排序的基础上,基于用户针对所匹配网页的个性化反馈信息,对所述搜索结果进行排序的步骤,可以包括通过基础排序方案得到所匹配网页的 基础排序参数;当搜索结果中两个或多个网页的基础排序参数的差值或者距离在一定阈值范围内时,基于用户针对所述两个或多个网页的个性化反馈信息,得到所述两个或多个网页的辅助排序参数;依据所述两个或多个网页的辅助排序参数,对其排序位置进行调整。优选的,通过以下方式获得一网页的辅助排序参数基于所收集的各用户针对该网页的个性化反馈信息的数目,得到该网页的辅助排序参数;或者,基于所收集的各用户针对该网页的个性化反馈信息中,赞同和/或推荐该网页的数目总和,得到该网页的辅助排序参数;或者,基于所收集的各用户针对该网页的个性化反馈信息中,赞同和/或推荐该网页的数目占全部反馈数目的比例,得到该网页的辅助排序参数;或者,所收集的各用户针对该网页的个性化反馈信息包括用户针对该网页的评分,基于所述评分得到该网页的辅助排序参数。优选的,所述的方法还可以包括在搜索结果页面中展示与搜索结果页相应的个性化反馈信息。优选的,所述的方法还可以包括在用户选择所述搜索结果,加载相应的网页时,由当前网页之外的应用程序展现针对当前网页的个性化反馈信息。依据本专利技术的另一实施例,还公开了一种信息搜索的系统,可以包括搜索单元,用于基于所接收的用户输入的搜索关键词,搜索与所述关键词相匹配的网页,得到搜索结果;排序单元,用于在基础排序的基础上,基于用户针对所匹配网页的个性化反馈信息,对所述搜索结果进行排序;展现单元,用于依据排序结果,对所述搜索结果进行展现。优选的,所述信息搜索的系统还可以包括反馈信息收集子系统,用于收集用户针对所匹配网页的个性化反馈信息,具体包括收集单元,用于由独立于网页之外的应用程序接收用户发送的针对网页的个性化反馈信息;存储单元,用于将所述个性化反馈信息和对应的网页标识保存至服务器,所述服务器存储有多个不同域名下的网页的网页标识和个性化反馈信息。优选的,所述排序单元具体可以包括基础排序子模块,用于通过基础排序方案得到所匹配网页的基础排序参数;辅助排序子模块,用于基于用户针对所匹配网页的个性化反馈信息,得到各网页的辅助排序参数;组合排序子模块,用于对各网页的基础排序参数和辅助排序参数进行加权平均;依据各网页的加权平均结果,对所述搜索结果进行排序。优选的,所述排序单元具体可以包括基础排序子模块,用于通过基础排序方案得到所匹配网页的基础排序参数;辅助排序子模块,用于基于用户针对所匹配网页的个性化反馈信息,得到各网页的辅助排序参数;排序调整子模块,用于当搜索结果中两个或多个网页的基础排序参数的差值或者距离在一定阈值范围内时,依据所述两个或多个网页的辅助排序参数,对其排序位置进行调整。优选的,所述排序单元具体可以包括基础排序子模块,用于通过基础排序方案得到所匹配网页的基础排序参数;排序优化子模块,用于当搜索结果中两个或多个网页的基础排序参数的差值或者距离在一定阈值范围内时,基于用户针对所述两个或多个网页的个性化反馈信息,得到所述两个或多个网页的辅助排序参数;依据所述两个或多个网页的辅助排序参数,对其排序位置进行调整。优选的,所述信息搜索的系统还可以包括第一反馈信息展示单元,用于在搜索结 果页面中展示与搜索结果页相应的个性化反馈信息。优选的,所述信息搜索的系统还可以包括第二反馈信息展示单元,用于在用户选择所述搜索结果,加载相应的网页时,由当前网页之外的应用程序展现针对当前网页的个性化反馈信息。与现有技术相比,本专利技术具有以下优点本专利技术的信息搜索方法,在现有的各种搜索排序方案的基础上(在本专利中称为基础排序方案),引入了用户针对网页的个性化反馈信息,以优化现有的搜索排序方案。由于所述个性化反馈信息能够在一定程度上反映用户对网页的关注度以及用户对该网页浏览后的反馈信息等等,即通过用户反馈可以过滤掉大部分的无效网页。因此,本专利技术能够在克服现有的各种搜索排序方案仅仅依靠自身算法,排序方式过于单一的缺陷,提高对网页搜索的准确度,使得搜索结果更加接近于用户的真实搜索需求。其次,本专利技术还可以将个性化反本文档来自技高网...

【技术保护点】
一种信息搜索的方法,其特征在于,包括:接收用户输入的搜索关键词;搜索与所述关键词相匹配的网页,得到搜索结果;在基础排序的基础上,基于用户针对所匹配网页的个性化反馈信息,对所述搜索结果进行排序;依据排序结果,对所述搜索结果进行展现。

【技术特征摘要】
1.一种信息搜索的方法,其特征在于,包括 接收用户输入的搜索关键词; 搜索与所述关键词相匹配的网页,得到搜索结果; 在基础排序的基础上,基于用户针对所匹配网页的个性化反馈信息,对所述搜索结果进行排序; 依据排序结果,对所述搜索结果进行展现。2.如权利要求I所述的方法,其特征在于,所述用户针对所匹配网页的个性化反馈信息的收集过程,包括 由独立于网页之外的应用程序接收用户发送的针对网页的个性化反馈信息; 以及,将所述个性化反馈信息和对应的网页标识保存至服务器,所述服务器存储有多个不同域名下的网页的网页标识和个性化反馈信息。3.如权利要求I所述的方法,其特征在于,所述在基础排序的基础上,基于用户针对所匹配网页的个性化反馈信息,对所述搜索结果进行排序的步骤,包括 通过基础排序方案得到所匹配网页的基础排序参数; 基于用户针对所匹配网页的个性化反馈信息,得到各网页的辅助排序参数; 对各网页的基础排序参数和辅助排序参数进行加权平均; 依据各网页的加权平均结果,对所述搜索结果进行排序。4.如权利要求I所述的方法,其特征在于,所述在基础排序的基础上,基于用户针对所匹配网页的个性化反馈信息,对所述搜索结果进行排序的步骤,包括 通过基础排序方案得到所匹配网页的基础排序参数; 基于用户针对所匹配网页的个性化反馈信息,得到各网页的辅助排序参数; 当搜索结果中两个或多个网页的基础排序参数的差值或者距离在一定阈值范围内时,依据所述两个或多个网页的辅助排序参数,对其排序位置进行调整。5.如权利要求I所述的方法,其特征在于,所述在基础排序的基础上,基于用户针对所匹配网页的个性化反馈信息,对所述搜索结果进行排序的步骤,包括 通过基础排序方案得到所匹配网页的基础排序参数; 当搜索结果中两个或多个网页的基础排序参数的差值或者距离在一定阈值范围内时,基于用户针对所述两个或多个网页的个性化反馈信息,得到所述两个或多个网页的辅助排序参数; 依据所述两个或多个网页的辅助排序参数,对其排序位置进行调整。6.如权利要求1、3、4或5所述的方法,其特征在于,通过以下方式获得一网页的辅助排序参数 基于所收集的各用户针对该网页的个性化反馈信息的数目,得到该网页的辅助排序参数; 或者,基于所收集的各用户针对该网页的个性化反馈信息中,赞同和/或推荐该网页的数目总和,得到该网页的辅助排序参数; 或者,基于所收集的各用户针对该网页的个性化反馈信息中,赞同和/或推荐该网页的数目占全部反馈数目的比例,得到该网页的辅助排序参数; 或者,所收集的各用户针对该网页的个性化反馈信息包括用户针对该网页的评分,基于所述评分得到该网页的辅助排序参数。7.如权利要求I或2所述的方法,其特征在于,还包括 在搜...

【专利技术属性】
技术研发人员:车东郭柱
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1