一种网页推送方法及装置制造方法及图纸

技术编号:11380044 阅读:56 留言:0更新日期:2015-05-01 00:57
本发明专利技术实施例公开了一种网页推送方法,包括:根据多个网页之间相互转移次数,建立所述多个网页的转移矩阵;将所述多个网页的转移矩阵生成得到所述多个网页的关联度排布表,所述关联度排布表包括所述多个网页中的其他各个网页分别转移到所述多个网页中的目标网页的次数;根据所述关联度排布表,确定所述多个网页之间的转移比值;根据所述多个网页之间的转移比值,从所述多个网页中确定推送的网页。本发明专利技术实施例还公开了一种网页推送装置。采用本发明专利技术实施例,可以提高网页推送的准确性。

【技术实现步骤摘要】
一种网页推送方法及装置
本专利技术涉及数据挖掘领域,尤其涉及一种网页推送方法及装置。
技术介绍
目前判断网页和新闻的受欢迎程度有很多,但是大多数是根据网页的点击量,回复量和用户评分这几个方面来对其进行评价。在现有技术方案中,首先将有链接关系的网页统一附上相同的PageRank(网页级别)值,再假设网页浏览者每次以同一概率由当前网页跳转到另一个页面,若当前网页没有链接,则以一个较小的概率跳转到其他任意一个页面,每一次计算相关网页的PageRank值都会发生改变。若某个网页是重要的,则有较多的网页会跳转到它,或者跳转到它的网页都比较重要。但是其缺点也非常明显,第一是忽略了主题相关性,第二是旧的页面比新的页面PageRank值肯定会高,因此网页推送的准确性不高。
技术实现思路
本专利技术实施例提供一种网页推送方法及装置。可以提高网页推送的准确性。本专利技术实施例提供了一种网页推送方法,包括:根据多个网页之间相互转移次数,建立所述多个网页的转移矩阵;将所述多个网页的转移矩阵生成得到所述多个网页的关联度排布表,所述关联度排布表包括所述多个网页中的其他各个网页分别转移到所述多个网页中的目标网页的次数;根据所述关联度排布表,确定所述多个网页之间的转移比值;根据所述多个网页之间的转移比值,从所述多个网页中确定推送的网页。其中,所述多个网页中的所述其他各个网页分别转移到所述多个网页中的目标网页的次数按照从大到小的顺序进行排列。其中,所述根据所述关联度排布表,确定所述多个网页之间的转移比值包括:计算所述其他网页中的第一网页转移所述目标网页的次数与所述其他网页中的第二网页转移到所述目标网页的次数的比值得到所述多个网页之间的转移比值,所述第一网页转移所述目标网页的次数与所述第二网页转移到所述目标网页的次数在所述关联度排布表中相邻排列。其中,所述根据所述多个网页之间的转移比值,从所述多个网页中确定推送的网页包括:若所述其他网页中的第一网页转移所述目标网页的次数与所述其他网页中的第二网页转移到所述目标网页的次数的比值大于第一预设阈值,则推送所述第一网页。其中,所述根据所述多个网页的关联度排布表,确定所述多个网页之间的转移比值之前,还包括:根据所述多个网页中的其他各个网页分别转移到所述目标网页的次数,确定所述目标网页的权重参考值;若所述目标网页的权重参考值大于第二预设阈值,则执行所述根据所述关联度排布表确定所述多个网页之间的转移比值的步骤。其中,所述根据所述多个网页的关联度排布表,确定所述多个网页中目标网页的权重参考值之前,还包括:获取推送网页的准确率以及召回率,所述推送网页的准确率为所述多个网页中用户浏览网页的数量与所述推送网页的数量的比值,所述召回率为所述多个网页中用户浏览网页的数量与所述推送网页中用户浏览网页的数量的比值;根据所述推送网页的准确率以及召回率,计算所述推送网页的评分指标;根据所述推送网页的评分指标,确定对所述目标网页的权重参考值是否进行调整。相应地,本专利技术实施例提供了一种网页推送装置,包括:矩阵建立模块,用于根据多个网页之间相互转移次数,建立所述多个网页的转移矩阵;排布表生成模块,用于将所述多个网页的转移矩阵生成得到所述多个网页的关联度排布表,所述关联度排布表包括所述多个网页中的其他各个网页分别转移到所述多个网页中的目标网页的次数;比值计算模块,用于根据所述关联度排布表,确定所述多个网页之间的转移比值;网页确定模块,用于根据所述多个网页之间的转移比值,从所述多个网页中确定推送的网页。其中,所述多个网页中的所述其他各个网页分别转移到所述多个网页中的目标网页的次数按照从大到小的顺序进行排列。其中,所述比值计算模块,具体用于计算所述其他网页中的第一网页转移所述目标网页的次数与所述其他网页中的第二网页转移到所述目标网页的次数的比值得到所述多个网页之间的转移比值,所述第一网页转移所述目标网页的次数与所述第二网页转移到所述目标网页的次数在所述关联度排布表中相邻排列。其中,所述网页确定模块,具体用于若所述其他网页中的第一网页转移所述目标网页的次数与所述其他网页中的第二网页转移到所述目标网页的次数的比值大于第一预设阈值,则推送所述第一网页。其中,所述装置还包括:权值确定模块,用于根据所述多个网页中的其他各个网页分别转移到所述目标网页的次数,确定所述目标网页的权重参考值;取值比较模块,用于若所述目标网页的权重参考值大于第二预设阈值,则执行所述根据所述关联度排布表确定所述多个网页之间的转移比值的步骤。其中,所述装置还包括:数据获取模块,用于获取推送网页的准确率以及召回率,所述推送网页的准确率为所述多个网页中用户浏览网页的数量与所述推送网页的数量的比值,所述召回率为所述多个网页中用户浏览网页的数量与所述推送网页中用户浏览网页的数量的比值;指标计算模块,用于指标根据所述推送网页的准确率以及召回率,计算所述推送网页的评价指标;调整确定模块,用于根据所述推送网页的评价指标,确定对所述目标网页的权重参考值是否进行调整。实施本专利技术实施例,首先根据多个网页之间相互转移次数,建立所述多个网页的转移矩阵;然后将所述多个网页的转移矩阵生成得到所述多个网页的关联度排布表,所述关联度排布表包括所述多个网页中的其他各个网页分别转移到所述多个网页中的目标网页的次数;其次根据所述关联度排布表,确定所述多个网页之间的转移比值;最后根据所述多个网页之间的转移比值,从所述多个网页中确定推送的网页,从而提高网页推送的准确性。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术提出的一种网页推送方法的第一实施例流程图;图2是本专利技术实施例提供的一种多个网页的转移矩阵的示意图;图3是本专利技术实施例提供的一种多个网页的关联度排布表的示意图;图4是本专利技术提出的一种网页推送方法的另一实施例的流程图;图5是本专利技术实施例提出的一种网页推送装置的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参考图1,图1是本专利技术提出的一种网页推送方法的第一实施例流程图。如图所示,本专利技术实施例中的网页推送方法包括:S101,根据多个网页之间相互转移次数,建立所述多个网页的转移矩阵。具体实现中,如图2所示,矩阵中的news1~newsn表示n个网页,a11、a22以及ann等数值为0,a1n表示从第一新闻转移到第n新闻的次数,a2n表示第二新闻转移到第n新闻的次数,其他依次类推。S102,将所述多个网页的转移矩阵生成得到所述多个网页的关联度排布表,所述关联度排布表包括所述多个网页中的其他各个网页分别转移到所述多个网页中的目标网页的次数。具体实现中,可以将所述多个网页中的所述其他各个网页分别转移到所述多个网页中的目标网页的次数按照从大到小的顺序进行排列。例如:如图3所示,第二列的字符串本文档来自技高网...
一种网页推送方法及装置

【技术保护点】
一种网页推送方法,其特征在于,所述方法包括:根据多个网页之间相互转移次数,建立所述多个网页的转移矩阵;将所述多个网页的转移矩阵生成得到所述多个网页的关联度排布表,所述关联度排布表包括所述多个网页中的其他各个网页分别转移到所述多个网页中的目标网页的次数;根据所述关联度排布表,确定所述多个网页之间的转移比值;根据所述多个网页之间的转移比值,从所述多个网页中确定推送的网页。

【技术特征摘要】
1.一种网页推送方法,其特征在于,所述方法包括:根据多个网页之间相互转移次数,建立所述多个网页的转移矩阵;将所述多个网页的转移矩阵生成得到所述多个网页的关联度排布表,所述关联度排布表包括所述多个网页中的其他各个网页分别转移到所述多个网页中的目标网页的次数;根据所述多个网页中的所述其他各个网页分别转移到所述目标网页的次数,确定所述目标网页的权重参考值;若所述目标网页的权重参考值大于第二预设阈值,则计算所述其他网页中的第一网页转移所述目标网页的次数与所述其他网页中的第二网页转移到所述目标网页的次数的比值得到所述多个网页之间的转移比值,所述第一网页转移所述目标网页的次数与所述第二网页转移到所述目标网页的次数在所述关联度排布表中相邻排列;若所述其他网页中的第一网页转移所述目标网页的次数与所述其他网页中的第二网页转移到所述目标网页的次数的比值大于第一预设阈值,则推送所述第一网页。2.如权利要求1所述的方法,其特征在于,所述多个网页中的所述其他各个网页分别转移到所述多个网页中的目标网页的次数按照从大到小的顺序进行排列。3.如权利要求1所述的方法,其特征在于,所述根据所述多个网页的关联度排布表,确定所述多个网页中目标网页的权重参考值之前,还包括:获取推送网页的准确率以及召回率,所述推送网页的准确率为所述多个网页中用户浏览网页的数量与所述推送网页的数量的比值,所述召回率为所述多个网页中用户浏览网页的数量与所述推送网页中用户浏览网页的数量的比值;根据所述推送网页的准确率以及召回率,计算所述推送网页的评分指标;根据所述推送网页的评分指标,确定对所述目标网页的权重参考值是否进行调整。4.一种网页推送装置,其特征在于,所述...

【专利技术属性】
技术研发人员:周丰丰姚曌旻仲任周曼丽葛瑞泉赵苗苗
申请(专利权)人:深圳先进技术研究院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1