一种用于基于扩展推荐事件更新网页权威值的方法与设备技术

技术编号:7509142 阅读:248 留言:0更新日期:2012-07-11 07:51
本发明专利技术的目的是提供一种用于基于扩展推荐事件更新网页权威值的方法与设备。其中,更新设备获取权威值待更新的第一网页;获取所述第一网页的扩展推荐事件;根据所述扩展推荐事件的事件相关信息,确定所述第一网页的第一权威值;根据所述第一权威值,更新所述第一网页的当前权威值。与现有技术相比,本发明专利技术基于扩展推荐事件更新网页权威值,将扩展推荐事件纳入到网页排序算法中,使得网页权威值的参考因素更为全面,从而使得网页权威值计算更为准确,提高了搜索引擎的准确率和召回率,以及搜索结果的排序质量,同时提升了用户的使用体验。

【技术实现步骤摘要】

本专利技术涉及网络搜索
,尤其涉及一种用于基于扩展推荐事件更新网页权威值的技术。
技术介绍
现有的网页排序算法,大多数都是基于页面之间的链接关系,他们将超链接视为一种推荐行为,并基于此计算这些超链接指向的页面的权威值。但是,随着互联网的发展,网页被推荐已经不仅仅表现为超链接,而是具有多种表现形式,例如,在即时通信消息中推荐网页、用户收藏网页、在社区网络中发布网页、以及网页转载等等。由于搜索引擎的网页抓取工具,如“网络蜘蛛(spider)”、“网络爬虫 (crawler) ”或者“机器人(robot) ”等的功能限制,搜索引擎无法获取上述除了超链接以外的其他形式的网页推荐行为,而仅就页面链接关系得出的页面权威值已经不能全面反映页面的真实权威值,从而降低了搜索引擎的准确率和召回率,同时影响搜索结果的排序质量。因此,如何提供一种基于扩展推荐事件更新网页权威值的方法,成为目前急需解决的问题之一。
技术实现思路
本专利技术的目的是提供一种用于基于扩展推荐事件更新网页权威值的方法与设备。根据本专利技术的一个方面,提供了一种由计算机实现的用于基于扩展推荐事件更新网页权威值的方法,其中,该方法包括以下步骤a获取权威值待更新的第一网页;b获取所述第一网页的扩展推荐事件;c根据所述扩展推荐事件的事件相关信息,确定所述第一网页的第一权威值;d根据所述第一权威值,更新所述第一网页的当前权威值。根据本专利技术的另一个方面,还提供了一种用于基于扩展推荐事件更新网页权威值的设备,其中,该设备包括第一获取装置,用于获取权威值待更新的第一网页;第二获取装置,用于获取所述第一网页的扩展推荐事件;确定装置,用于根据所述扩展推荐事件的事件相关信息,确定所述第一网页的第一权威值;更新装置,用于根据所述第一权威值,更新所述第一网页的当前权威值。与现有技术相比,本专利技术基于扩展推荐事件更新网页权威值,将扩展推荐事件纳入到网页排序算法中,使得网页权威值的参考因素更为全面,从而使得网页权威值计算更为准确,提高了搜索引擎的准确率和召回率,以及搜索结果的排序质量,同时提升了用户的使用体验。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显图1示出根据本专利技术一个方面的用于基于扩展推荐事件更新网页权威值的更新设备的示意图;图2示出根据本专利技术另一个方面的用于基于扩展推荐事件更新网页权威值的方法流程图。附图中相同或相似的附图标记代表相同或相似的部件。 具体实施例方式下面结合附图对本专利技术作进一步详细描述。图1为根据本专利技术一个方面的设备示意图,示出用于基于扩展推荐事件更新网页权威值的更新设备。其中,更新设备1包括第一获取装置11、第二获取装置12、确定装置13 和更新装置14。具体地,第一获取装置11获取权威值待更新的第一网页;随后,第二获取装置12获取所述第一网页的扩展推荐事件;接着,确定装置13根据所述扩展推荐事件的事件相关信息,确定所述第一网页的第一权威值;随后,更新装置14根据所述第一权威值,更新所述第一网页的当前权威值。在此,更新设备1包括但不限于搜索引擎服务器或者与之相连的专用服务器。更具体地,第一获取装置11获取权威值待更新的第一网页。具体地,第一获取装置11从诸如搜索引擎服务器、与之相连的其他设备或者可经由网络访问的第三方服务器, 获取权威值待更新的第一网页。例如,第一获取装置11根据搜索引擎服务器提供的应用程序接口(API),向其发送获取权威值待更新的第一网页的请求,接收该搜索引擎服务器基于该请求返回的权威值待更新的第一网页。本领域技术人员应能理解上述获取第一网页的方式仅为举例,其他现有的或今后可能出现的获取第一网页的方式如可适用于本专利技术,也应包含在本专利技术保护范围以内,并以引用方式包含于此。随后,第二获取装置12获取所述第一网页的扩展推荐事件。具体地,第二获取装置12根据第一获取装置11获取的权威值待更新的第一网页,获取该第一网页的扩展推荐事件,如即时通信消息中推荐该第一网页,或者用户收藏该第一网页等。例如,第一获取装置11获取的权威值待更新的第一网页,第二获取装置12根据该第一网页,按照约定的通信方式,如Http、Https等通信协议,定期向即时通信服务器发送获取该第一网页的扩展推荐事件的请求,接收该即时通讯服务器返回的扩展推荐事件。又如,用户收藏第一网页,该第一网页相应的网站服务器通过其应用程序接口(API),将该扩展推荐事件推送至更新设备 1,相应地,更新设备1的第二获取装置12接收该扩展推荐事件。本领域技术人员应能理解上述获取扩展推荐事件的方式仅为举例,其他现有的或今后可能出现的获取扩展推荐事件的方式如可适用于本专利技术,也应包含在本专利技术保护范围以内,并以引用方式包含于此。接着,确定装置13根据所述扩展推荐事件的事件相关信息,确定所述第一网页的第一权威值。具体地,第二获取装置12获取第一网页的扩展推荐事件,确定装置13根据这 (些)扩展推荐事件的相关信息,诸如即时通讯消息的推荐用户的等级、社区网络中发布用户的等级等,确定该第一网页的第一权威值。例如,第二获取装置12获取的扩展推荐事件为用户在即时通信消息中推荐该第一网页,确定装置13根据该扩展推荐事件的相关信息, 如该推荐用户在该即时通信消息所属即时通信系统中的等级为2级,确定该第一网页的第一权威值为2。本领域技术人员应能理解上述确定第一权威值的方式仅为举例,其他现有的或今后可能出现的确定第一权威值的方式如可适用于本专利技术,也应包含在本专利技术保护范围以内,并以引用方式包含于此。随后,更新装置14根据所述第一权威值,更新所述第一网页的当前权威值。具体地,更新装置14根据确定装置13确定的第一网页的第一权威值,更新该第一网页的当前权威值。例如,对不同的扩展推荐事件赋予不同的权重,各扩展推荐事件对应的权威值加权后得到该第一网页的第一权威值,将该第一权威值与第一网页的当前权威值相累加,以更新该第一网页的当前权威值。在此,每次扩展推荐事件不但可以对应一个第一权威值,作为第一网页的权威值参考量以更新该第一网页的当前权威值;还可以被视为一次对该第一网页的引用,也即可以作为一个第一网页的虚拟导入页面,从而将该第一权威值作为该第一网页的导入链接的传导权威值,纳入现有的各种基于页面链接关系的网页排序算法,如 pagerank, HITS等算法,以更精确的计算该第一网页的权威度。本领域技术人员应能理解上述更新当前权威值的方式仅为举例,其他现有的或今后可能出现的更新当前权威值的方式如可适用于本专利技术,也应包含在本专利技术保护范围以内,并以引用方式包含于此。优选地,第一获取装置11、第二获取装置12、确定装置13和更新装置14是持续不断工作的。具体地,第一获取装置11获取权威值待更新的第一网页;随后,第二获取装置12 获取所述第一网页的扩展推荐事件;接着,确定装置13根据所述扩展推荐事件的事件相关信息,确定所述第一网页的第一权威值;随后,更新装置14根据所述第一权威值,更新所述第一网页的当前权威值。在此,本领域技术人员应理解“持续”是指第一获取装置11、第二获取装置12、确定装置13和更新装置14分别按照设定的或实时调整的工作模式要求进行第一网页的获取、扩展推荐事件的获取、本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:杨宣姚旭
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术