进行信息搜索的方法及服务器技术

技术编号:9462846 阅读:106 留言:0更新日期:2013-12-19 00:12
本发明专利技术提供了进行信息搜索的方法及服务器,其中,该方法预先获取用户的所有网络服务页面信息,存储于用户页面数据库;该方法还包括:接收搜索用户包含关键词的搜索请求;根据所述关键词在全量倒排数据库中搜索得到公共网页条目,获取各公共网页条目的页面得分;根据所述关键词在所述用户页面数据库中搜索得到所述搜索用户的所有好友的好友网页条目,获取相应好友网页条目的页面得分;按照页面得分对搜索得到的公共网页条目和好友网页条目进行降序排序,将排序后的网页条目反馈给所述搜索用户。本发明专利技术方案能够将好友网页条目显示在搜索结果中,使搜索结果更遵循用户的查询需求。

【技术实现步骤摘要】
【专利摘要】本专利技术提供了进行信息搜索的方法及服务器,其中,该方法预先获取用户的所有网络服务页面信息,存储于用户页面数据库;该方法还包括:接收搜索用户包含关键词的搜索请求;根据所述关键词在全量倒排数据库中搜索得到公共网页条目,获取各公共网页条目的页面得分;根据所述关键词在所述用户页面数据库中搜索得到所述搜索用户的所有好友的好友网页条目,获取相应好友网页条目的页面得分;按照页面得分对搜索得到的公共网页条目和好友网页条目进行降序排序,将排序后的网页条目反馈给所述搜索用户。本专利技术方案能够将好友网页条目显示在搜索结果中,使搜索结果更遵循用户的查询需求。【专利说明】进行信息搜索的方法及服务器
本专利技术涉及信息处理技术,尤其涉及进行信息搜索的方法及服务器。
技术介绍
现有的信息搜索方法包括:用户终端接收用户输入的关键词,向网络侧服务器发送包含关键词的搜索请求;服务器根据关键词在全量倒排数据库中搜索得到网页条目,计算各网页条目的页面得分,由页面得分对搜索出的众多网页条目进行降序排序,将排序后的网页条目反馈给用户终端。而后,用户终端将排序后的网页条目展示给用户,每个网页条目对应一个网页,用户点击某网页条目,便可展示对应的网页。计算页面得分的方法包括:计算网页条目的页面原始得分和页面因素因子,用页面原始得分乘以页面因素因子,将得到的乘积作为相应页面条目的页面得分。页面原始得分主要体现的是关键词在页面的重要程度,目前计算页面原始得分的方式有多种,这里以倒排文档频率(IDF, Inverse Document Frequency)计算方法进行说明。例如关键词为“专利技术”,“专利技术”在某页面的出现频率,即该页面的原始得分,关键词在页面的出现频率可采用IDF公式计算得到。用于计算页面得到的页面因素因子包括至少一个,例如包括引用值,引用值为某页面被其他页面引用的几率。参见图1,为现有技术中页面之间引用(链接)关系的实例,其中,页面A被页面B和页面C引用,页面D被页面A引用,则页面A、页面B、页面C和页面D的引用值大小排序为:页面A>页面D>页面B=页面C。这里,以关键词“专利技术”为例,图2示出了搜索后用户终端展示的部分网页条目,包括:关于“中国专利技术网”的网页条目,关于“《我爱专利技术》官网”的网页条目,关于“专利技术搜搜百科”的网页条目,关于“专利技术专利I专利技术创造-瞧这网专利技术专利频道”的网页条目,关于“北京专利技术协会”的网页条目;图中的省略号为各网页条目的概述。目前的搜索引擎工具中提供了采用用户标识登陆搜索平台的功能,用户可采用登录状态进行信息搜索。实际应用中,提供搜索引擎业务的运营商可能还提供了其他业务,这些业务都有让用户发表内容的页面;一个用户可能通过同一用户标识使用了除搜索引擎业务外的其他业务,并在这些业务中发表了内容,向服务器上传了网页数据;而每个用户有多个好友,用户在进行信息搜索时,常希望根据输入的关键词搜索好友在其他业务中上传的网页数据,但是,现有的信息搜索方案无法提供好友网页条目,不能满足需求。例如,腾讯运营商提供的业务包括SOSO搜索引擎业务、QQ空间业务、腾讯微博业务、腾讯说说业务等;同一用户可能通过同一用户标识使用了除SOSO搜索引擎业务外的其他业务,还在其他业务中向服务器上传了网页数据,如在QQ空间业务中向QQ空间服务器上传了关于个人日志的网页数据,再如在腾讯微博业务中向腾讯微博服务器上传了关于微博信息的网页数据,所述用户标识具体如QQ账号;当用户A采用腾讯的soso搜索引擎工具(搜索网址为WWW, sos0.com)进行搜索时输入关键词“专利技术”时,如果soso搜索引擎工具能够同时提供用户A的好友在其他业务中上传的关于“专利技术”的好友网页条目,将更加遵循用户的查询需求;但目前还没有这样的技术。
技术实现思路
本专利技术提供了一种进行信息搜索的方法,该方法能够将好友网页条目显示在搜索结果中,使搜索结果更遵循用户的查询需求。本专利技术提供了一种进行信息搜索的服务器,该服务器能够将好友网页条目显示在搜索结果中,使搜索结果更遵循用户的查询需求。一种进行信息搜索的方法,该方法包括:获取用户的所有网络服务页面信息,存储于用户页面数据库;接收搜索用户包含关键词的搜索请求;根据所述关键词在全量倒排数据库中搜索得到公共网页条目,获取各公共网页条目的页面得分;根据所述关键词在所述用户页面数据库中搜索得到所述搜索用户的所有好友的好友网页条目,获取相应好友网页条目的页面得分;按照页面得分对搜索得到的公共网页条目和好友网页条目进行降序排序,将排序后的网页条目反馈给所述搜索用户。一种进行信息搜索的服务器,该服务器包括用户页面数据库生成模块、搜索请求接收模块、第一搜索计算模块、第二搜索计算模块和排序反馈模块;所述用户页面数据库生成模块,用于获取用户的所有网络服务页面信息,存储于用户页面数据库;所述搜索请求接收模块,用于接收搜索用户的包含关键词的搜索请求,发送给所述第一搜索计算模块所述第二搜索计算模块;所述第一搜索计算模块,用于根据所述关键词在全量倒排数据库中搜索得到公共网页条目,获取各公共网页条目的页面得分;将公共网页条目和页面得分发送给所述排序反馈模块;所述第二搜索计算模块,用于根据所述关键词在所述用户页面数据库中搜索得到所述搜索用户的所有好友的好友网页条目;获取好友网页条目的页面得分;将好友网页条目和页面得分发送给所述排序反馈模块;所述排序反馈模块,用于按照页面得分对搜索得到的公共网页条目和好友网页条目进行降序排序,将排序后的网页条目反馈给所述搜索用户。从上述方案可以看出,本专利技术预先获取用户的所有网络服务页面信息,存储于用户页面数据库,存储于用户页面数据库;在需要进行信息搜索时,根据搜索请求包含的关键词在全量倒排数据库中搜索得到公共网页条目,计算得到各公共网页条目的页面得分;并根据关键词在用户页面数据库中搜索得到搜索用户的所有好友的好友网页条目,计算得到各好友网页条目的页面得分;而后,按照页面得分对搜索得到的公共网页条目和好友网页条目进行降序排序,将排序后的网页条目反馈给用户终端。这样,实现了将好友网页条目显示在搜索结果中,使搜索结果更遵循用户的查询需求。【专利附图】【附图说明】图1为现有技术页面之间引用关系的实例;图2为现有技术用户终端展示给用户的网页条目实例;图3为本专利技术进行信息搜索的方法示意性流程图;图4为由关键词“深圳调干”搜索出的搜索结果条目;图5为本专利技术进行信息搜索的服务器结构示意图。【具体实施方式】为使本专利技术的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本专利技术进一步详细说明。本专利技术预先获取所有用户的所有网络服务页面信息,存储于用户页面数据库,优选地所述网络服务是同一个网络服务提供商提供的;而后,在需要时,根据关键词在用户页面数据库中搜索得到搜索用户的所有好友的好友网页条目,再将好友网页条目与从全量倒排数据库中搜索得到的公共网页条目进行统一排序,将排序后的网页条目反馈给用户终端;从而,实现了将好友网页条目显示在搜索结果中。参见图3,为本专利技术进行信息搜索的方法示意性流程图,该方法预先获取同一运营商提供的各业务下所有用户产生的页面数据,存储于用户页面数据库中。提供搜索引擎业务的运营商还可能提供了其他业务,这些本文档来自技高网
...

【技术保护点】
一种进行信息搜索的方法,包括:获取用户的所有网络服务页面信息,存储于用户页面数据库;接收搜索用户包含关键词的搜索请求;根据所述关键词在全量倒排数据库中搜索得到公共网页条目,获取各公共网页条目的页面得分;根据所述关键词在所述用户页面数据库中搜索得到所述搜索用户的所有好友的好友网页条目,获取相应好友网页条目的页面得分;按照页面得分对搜索得到的公共网页条目和好友网页条目进行降序排序,将排序后的网页条目反馈给所述搜索用户。

【技术特征摘要】

【专利技术属性】
技术研发人员:谢朴锐
申请(专利权)人:深圳市世纪光速信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1