信息推荐方法和信息推荐系统技术方案

技术编号:11113916 阅读:59 留言:0更新日期:2015-03-05 18:38
本发明专利技术提供了一种信息推荐方法和一种信息推荐系统,其中,信息推荐方法的流程包括:根据服务器的行为日志数据库中的行为日志,生成邻接矩阵;将邻接矩阵转化为超链接矩阵;根据超链接矩阵,为服务器的预设PageRank模型训练器选取初始参数;根据初始参数,通过预设PageRank模型训练器计算PageRank向量,并记录迭代次数;按照从高到低的方式输出迭代后的PageRank向量;其中,预设PageRank模型训练器的计算公式为:通过本发明专利技术的技术方案,对原经典的PageRank算法中的权威值平均分配问题和仅考虑出链的问题进行了改进,使得在实际应用中的迭代数据更快,并且更能考虑到不同用户具有不同层次的权威度,从而在实际的企业推荐和搜索中具有更高的搜索和推荐质量。

【技术实现步骤摘要】

本专利技术涉及数据处理
,具体而言,涉及一种信息推荐方法和一种信息推荐系统。
技术介绍
目前,用户工作圈中的行为日志包括许多的行为信息,包括用户和用户的交互信息、用户和圈子的交互信息,但是大量的行为信息处于初始没有挖掘的状态,我们希望从行为信息中挖掘相关数据去改进搜索和推荐质量。现有技术中的搜索和推荐主要采用的是用户行为和查询串分词与索引匹配的综合排序的方式。但是,现有技术中的推荐和搜索存在如下两条缺点:第一,对于没有行为信息的用户的推荐主要还是采用的是索引匹配的方式,但是该方式没有考虑群体的行为信息或者不能对“行为次数多、具有人气、比较权威”的用户进行推荐。第二,企业的数据虽然真实度比较高、冗余度小,但是当搜索和推荐的数据量比较大的时候,用户可以在某些字段上采用增加关键词等冗余的方法进行作弊,然后进入索引项,从而欺骗搜索系统。因此需要一种新的技术方案,可以提升用户推荐的质量。
技术实现思路
本专利技术正是基于上述问题,提出了一种新的技术方案,可以提升用户推荐的质量。有鉴于此,本专利技术的第一方面的实施例提出了一种信息推荐方法,包括:根据所述服务器的行为日志数据库中的行为日志,生成邻接矩阵;将所述邻接矩阵转化为超链接矩阵;根据所述超链接矩阵,为所述服务器的预设PageRank模型训练器选取初始参数;根据所述初始参数,通过所述预设PageRank模型训练器计算PageRank向量,并记录迭代次数;按照从高到低的方式输出迭代后的所述PageRank向量;其中,所述预设PageRank模型训练器的计算公式为: PR ( A ) = [ 1 - n Σ i = 1 n C ( T i ) · α ] 1 N + n Σ i = 1 n C ( T i ) · α Σ i = 1 n PR ( T i ) C ( T i ) ]]>其中,PR(A)为被推荐的用户A的所述PageRank向量,n为推荐所述用户A的所有用户的总数,N为涉及到推荐行为的总人数,Ti是推荐所述用户A的任一用户,C(Ti)表示所述任一用户Ti推荐其他用户的总次数,PR(Ti)为所述任一用户Ti的所述PageRank向量,i=1,2,...,n。在现有技术中,Google曾在公开发表的论文中,提到其经典的PageRank模型为以下形式: PR ( A ) = 1 - α N + α · Σ i = 1 N PR ( T i ) C ( T i ) ]]>其中,PR(A)为被推荐的用户A的所述PageRank向量,N为网页的总数,其中网页Ti是指向网页A的第i个源页面(链入页面),C(Ti)为网页Ti的链出页面的出度总数,i=1,2,...,n。该模型的含义指用户停留在某个页面,可能以1-α/N的概率随机进行浏览页面,可能以α概率顺着链接浏览页面。在本专利技术的技术方案中,针对上述现有技术中随机跳转因子α的平均分配的问题以及针对只考虑出度问题(C(Ti))的每个AT用户赋予相等的权重的问题进行了改进。其中,对权威值α的改进如下:针对权威值的平均分配问题,对于不同的网页它的随机跳转因子(阻尼系数)不一样,比如,行为次数多、具有人气、比较权威的用户比那些推荐较少、名气较低的用户更容易被推荐,所以,可以将经典PageRank模型改进为: PR ( A ) = [ 1 - n Σ i = 1 n C ( T i ) ] 1 N + 本文档来自技高网...

【技术保护点】
一种信息推荐方法,其特征在于,包括:根据所述服务器的行为日志数据库中的行为日志,生成邻接矩阵;将所述邻接矩阵转化为超链接矩阵;根据所述超链接矩阵,为所述服务器的预设PageRank模型训练器选取初始参数;根据所述初始参数,通过所述预设PageRank模型训练器计算PageRank向量,并记录迭代次数;按照从高到低的方式输出迭代后的所述PageRank向量;其中,所述预设PageRank模型训练器的计算公式为:PR(A)=[1-nΣi=1nC(Ti)·α]1N+nΣi=1nC(Ti)·αΣi=1nPR(Ti)C(Ti)]]>其中,PR(A)为被推荐的用户A的所述PageRank向量,n为推荐所述用户A的所有用户的总数,N为涉及到推荐行为的总人数,Ti是推荐所述用户A的任一用户,C(Ti)表示所述任一用户Ti推荐其他用户的总次数,PR(Ti)为所述任一用户Ti的所述PageRank向量,i=1,2,...,n。

【技术特征摘要】
1.一种信息推荐方法,其特征在于,包括:
根据所述服务器的行为日志数据库中的行为日志,生成邻接矩阵;
将所述邻接矩阵转化为超链接矩阵;
根据所述超链接矩阵,为所述服务器的预设PageRank模型训练器选
取初始参数;
根据所述初始参数,通过所述预设PageRank模型训练器计算
PageRank向量,并记录迭代次数;
按照从高到低的方式输出迭代后的所述PageRank向量;其中,
所述预设PageRank模型训练器的计算公式为:
PR ( A ) = [ 1 - n Σ i = 1 n C ( T i ) · α ] 1 N + n Σ i = 1 n C ( T i ) · α Σ i = 1 n PR ( T i ) C ( T i ) ]]>其中,PR(A)为被推荐的用户A的所述PageRank向量,n为推荐
所述用户A的所有用户的总数,N为涉及到推荐行为的总人数,Ti是推荐
所述用户A的任一用户,C(Ti)表示所述任一用户Ti推荐其他用户的总
次数,PR(Ti)为所述任一用户Ti的所述PageRank向量,i=1,2,...,n。
2.根据权利要求1所述的信息推荐方法,其特征在于,所述根据所
述服务器的行为日志数据库中的行为日志,生成邻接矩阵,具体包括:
从所述行为日志数据库中的所述行为日志中提取所有推荐信息,以所
述服务器的每个用户为节点,以推荐业务的使用者为起点,并以被推荐的
用户为终点建立边,以推荐的次数为所述边的权值,建立一个有向加权图;
将所述有向加权图存储在所述邻接矩阵中。
3.根据权利要求2所述的信息推荐方法,其特征在于,所述将所述
邻接矩阵转化为超链接矩阵,具体包括:
将所述有向加权图转化为所述超链接矩阵,其中,进行转化的计算公
式为:
H ( i , j ) = Adj ( i , j ) colSum ( i ) , when . . colSum ( i ) ! = 0 1 n , otherwise . ]]>其中,H(i,j)为所述超链接矩阵,i为所述任一用户,colSum(i)
为所述邻接矩阵中的所述任一用户推荐所述其他用户的总次数,n为涉及
到所述推荐行为的总人数。
4.根据权利要求1至3中任一项所述的信息推荐方法,其特征在于,
在所述通过所述预设PageRank模型训练器计算PageRank向量,并记录迭
代次数之后,包括:
判断所述迭代次数是否超过预定迭代次数阈值,并判断所述
PageRank向量与原所述PageRank向量是否超出预定迭代精度;
当判断结果都为是时,继续通过所述预设PageRank模型训练器进行
迭代操作,否则,按照从高到低的方式输出迭代后的所述PageRank向量。
5.根据权利要求4所述的信息推荐方法,其特征在于,所述初始参
数包括迭代向量、随机跳转因子、所述预定迭代精度和所述预定迭代次数
阈值。
6.一种信息推...

【专利技术属性】
技术研发人员:黄通文张俊林
申请(专利权)人:畅捷通信息技术股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1