推送包含新闻信息的网页的方法和装置制造方法及图纸

技术编号:10256815 阅读:128 留言:0更新日期:2014-07-25 11:54
本发明专利技术提供了一种推送包含新闻信息的网页的方法和装置,方法包括:将查询词与预存的时效性关键词进行匹配;如查询词与时效性关键词匹配,则获取查询词的时效性;根据查询词的时效性强弱,确定在结果页中插入的与时效性关键词对应的包含新闻信息的网页的URL的位置。根据本发明专利技术,在查询词与预设时效性关键词匹配时,分析查询词的时效性,查询词的时效性高低反映了新闻信息对于用户的新闻性高低程度,所以基于查询词时效性高低对包含新闻信息的网页URL进行排序,可将对用户来说新闻性较高的新闻信息所在网页URL排序在前。

【技术实现步骤摘要】
推送包含新闻信息的网页的方法和装置
本专利技术涉及计算机
,具体而言,涉及一种推送包含新闻信息的网页的方法和装置。
技术介绍
根据目前搜索引擎技术,用户在其终端上输入查询词后,搜索引擎会获取与查询词对应的多个网页URL,该多个网页URL返回到用户终端后,会在用户终端的结果页上展现。由于网页URL的数量为多个,则在结果页上展现时必然存在排序问题。根据目前的搜索引擎技术,一般排序在前的都是较旧的网页URL。这种排序对于包含新闻信息的网页URL来说存在较大缺陷:在用户输入查询词来搜索新闻的场景下,所以目前的搜索引擎技术只能将旧新闻的网页URL排序在前,而最新新闻的网页URL排序在后,但由于新闻具有时效性的特点,大部分新闻的新闻性都是随着时间的推移而降低,则用户最终查看到的很可能是新闻性较低的新闻,新闻性较高的新闻由于其网页URL排序靠后,用户难以发现并打开。由此可见,现有的搜索引擎技术难以分析新闻信息对用户的新闻性,难以恰当地对包含新闻信息的网页URL进行排序,进而无法完成对包含新闻信息的网页的有效推送。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的推送包含新闻信息的网页的方法和装置。依据本专利技术的一个方面,提供了一种推送包含新闻信息的网页的方法,其包括:将查询词与预存的时效性关键词进行匹配;如所述查询词与所述时效性关键词匹配,则获取所述查询词的时效性;根据所述查询词的时效性强弱,确定在结果页中插入的与所述时效性关键词对应的包含新闻信息的网页的URL的位置。可选地,所述获取所述查询词的时效性的步骤包括:获取所述查询词对应的多个网页的URL;计算所述多个网页与所述包含新闻信息的网页之间的差别;根据所述多个网页与所述包含新闻信息的网页之间的差别,计算所述查询词的时效性。可选地,所述计算所述多个网页与所述包含新闻信息的网页之间的差别的步骤包括:计算所述多个网页的第一时效属性特征;将所述第一时效属性特征与预存的所述包含新闻信息的网页的第二时效属性特征进行比较,得到所述多个网页与所述包含新闻信息的网页之间的差别。可选地,所述第一时效属性特征包括所述多个网页的分类、所述多个网页的生成时间、所述查询词在所述多个网页中出现的频度和/或所述查询词在所述多个网页中的出现次数与已知历史出现次数之间的对比数据。可选地,所述根据所述查询词的时效性强弱,确定在结果页中插入的与所述时效性关键词对应的包含新闻信息的网页的URL的位置的步骤包括:在所述结果页上划分多个区间,分别对应不同强弱程度的时效性;选择与所述查询词的时效性强弱匹配的区间,并将所述包含新闻信息的网页的URL置于所选区间中。可选地,每个区间分为自上而下的三个部分,且每个区间具有对应的置信度,所述将所述包含新闻信息的网页的URL置于所选区间中的步骤还包括:如所述查询词的时效性高于所选区间的置信度,则将所述包含新闻信息的网页的URL置于所选区间中的最上部分,如所述查询词的时效性与所选区间的置信度一致,则将所述包含新闻信息的网页的URL置于所选区间中的中间部分,如所述查询词的时效性低于所选区间的置信度,则将所述包含新闻信息的网页的URL置于所选区间中的最下部分。依据本专利技术的另一方面,还提供一种推送包含新闻信息的网页的装置,其包括:关键词数据库,用于预存时效性关键词;关键词匹配模块,用于将查询词与预存的时效性关键词进行匹配;查询词时效性获取模块,用于如所述查询词与所述时效性关键词匹配,则获取所述查询词的时效性;新闻网页展示模块,用于根据所述查询词的时效性强弱,确定在结果页中插入的与所述时效性关键词对应的包含新闻信息的网页的URL的位置。可选地,还包括:网页URL获取模块,用于获取所述查询词对应的多个网页的URL;差别计算模块,用于计算所述多个网页与所述包含新闻信息的网页之间的差别;所述查询词时效性获取模块根据所述多个网页与所述包含新闻信息的网页之间的差别,计算所述查询词的时效性。可选地,还包括:特征计算器,用于计算所述多个网页的第一时效属性特征;所述差别计算模块,用于将所述第一时效属性特征与预存的所述包含新闻信息的网页的第二时效属性特征进行比较,得到所述多个网页与所述包含新闻信息的网页之间的差别。可选地,所述第一时效属性特征包括所述多个网页的分类、所述多个网页的生成时间、所述查询词在所述多个网页中出现的频度和/或所述查询词在所述多个网页中的出现次数与已知历史出现次数之间的对比数据。可选地,所述新闻网页展示模块包括:区间划分模块,用于在所述结果页上划分多个区间,分别对应不同强弱程度的时效性;区间选择模块,用于选择与所述查询词的时效性强弱匹配的区间,并将所述包含新闻信息的网页的URL置于所选区间中。可选地,每个区间分为自上而下的三个部分,且每个区间具有对应的置信度,如所述查询词的时效性高于所选区间的置信度,则所述区间选择模块将所述包含新闻信息的网页的URL置于所选区间中的最上部分,如所述查询词的时效性与所选区间的置信度一致,则所述区间选择模块将所述包含新闻信息的网页的URL置于所选区间中的中间部分,如所述查询词的时效性低于所选区间的置信度,则所述区间选择模块将所述包含新闻信息的网页的URL置于所选区间中的最下部分。根据本专利技术的推送包含新闻信息的网页的方法和装置,在查询词与预设时效性关键词匹配时,说明时效性关键词对应的包含新闻信息的网页也是查询词对应的搜索结果,此时分析查询词的时效性,查询词的时效性高低反映了新闻信息对于用户的新闻性高低程度,所以基于查询词时效性高低对包含新闻信息的网页URL进行排序,可将对用户来说新闻性较高的新闻信息所在网页URL排序在前,方便用户及时查看到所需的新闻信息,从而实现包含新闻信息的网页的有效推送。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了根据本专利技术的一个实施例的推送包含新闻信息的网页的方法的流程图;图2示出了根据本专利技术的一个实施例的推送包含新闻信息的网页的方法的部分流程图;图3示出了根据本专利技术的一个实施例的推送包含新闻信息的网页的方法的部分流程图;图4示出了根据本专利技术的一个实施例的推送包含新闻信息的网页的装置的框图;图5示出了根据本专利技术的一个实施例的推送包含新闻信息的网页的装置的框图;图6示出了根据本专利技术的一个实施例的推送包含新闻信息的网页的装置的单个模块框图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。如图1所示,本专利技术的一个实施例提供了一种推送包含新闻信息的网页的方法,其包括:步骤110,将查询词与本文档来自技高网...
推送包含新闻信息的网页的方法和装置

【技术保护点】
一种推送包含新闻信息的网页的方法,其包括:将查询词与预存的时效性关键词进行匹配;如所述查询词与所述时效性关键词匹配,则获取所述查询词的时效性;根据所述查询词的时效性强弱,确定在结果页中插入的与所述时效性关键词对应的包含新闻信息的网页的URL的位置。

【技术特征摘要】
1.一种推送包含新闻信息的网页的方法,其包括:将查询词与预存的时效性关键词进行匹配;如所述查询词与所述时效性关键词匹配,则获取所述查询词的时效性;根据所述查询词的时效性强弱,确定在结果页中插入的与所述时效性关键词对应的包含新闻信息的网页的URL的位置;对所述包含新闻信息的网页进行推送;其中,所述根据所述查询词的时效性强弱,确定在结果页中插入的与所述时效性关键词对应的包含新闻信息的网页的URL的位置的步骤包括:在所述结果页上划分多个区间,分别对应不同强弱程度的时效性;选择与所述查询词的时效性强弱匹配的区间,并将所述包含新闻信息的网页的URL置于所选区间中。2.根据权利要求1所述的方法,其中,所述获取所述查询词的时效性的步骤包括:获取所述查询词对应的多个网页的URL;计算所述多个网页与所述包含新闻信息的网页之间的差别;根据所述多个网页与所述包含新闻信息的网页之间的差别,计算所述查询词的时效性。3.根据权利要求2所述的方法,其中,所述计算所述多个网页与所述包含新闻信息的网页之间的差别的步骤包括:计算所述多个网页的第一时效属性特征;将所述第一时效属性特征与预存的所述包含新闻信息的网页的第二时效属性特征进行比较,得到所述多个网页与所述包含新闻信息的网页之间的差别。4.根据权利要求3所述的方法,其中,所述第一时效属性特征包括所述多个网页的分类、所述多个网页的生成时间、所述查询词在所述多个网页中出现的频度和/或所述查询词在所述多个网页中的出现次数与已知历史出现次数之间的对比数据。5.根据权利要求1所述的方法,其中,每个区间分为自上而下的三个部分,且每个区间具有对应的置信度,所述将所述包含新闻信息的网页的URL置于所选区间中的步骤还包括:如所述查询词的时效性高于所选区间的置信度,则将所述包含新闻信息的网页的URL置于所选区间中的最上部分,如所述查询词的时效性与所选区间的置信度一致,则将所述包含新闻信息的网页的URL置于所选区间中的中间部分,如所述查询词的时效性低于所选区间的置信度,则将所述包含新闻信息的网页的URL置于所选区间中的最下部分。6.一种推送包含新闻信息...

【专利技术属性】
技术研发人员:常富洋秦吉胜苏文杰
申请(专利权)人:北京奇虎科技有限公司奇智软件北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1