【技术实现步骤摘要】
本专利技术涉及数据处理
,具体而言,涉及一种信息推荐方法和一种信息推荐系统。
技术介绍
目前,用户工作圈中的行为日志包括许多的行为信息,包括用户和用户的交互信息、用户和圈子的交互信息,但是大量的行为信息处于初始没有挖掘的状态,我们希望从行为信息中挖掘相关数据去改进搜索和推荐质量。现有技术中的搜索和推荐主要采用的是用户行为和查询串分词与索引匹配的综合排序的方式。但是,现有技术中的推荐和搜索存在如下两条缺点:第一,对于没有行为信息的用户的推荐主要还是采用的是索引匹配的方式,但是该方式没有考虑群体的行为信息或者不能对“行为次数多、具有人气、比较权威”的用户进行推荐。第二,企业的数据虽然真实度比较高、冗余度小,但是当搜索和推荐的数据量比较大的时候,用户可以在某些字段上采用增加关键词等冗余的方法进行作弊,然后进入索引项,从而欺骗搜索系统。因此需要一种新的技术方案,可以提升用户推荐的质量。
技术实现思路
本专利技术正是基于上述问题,提出了一种新的技术方案,可以提升用户推荐的质量。有鉴于此,本专利技术的第一方面的实施例提出了一种信息推荐方法,包括:根据所述服务器的行为日志数据库中的行为日志,生成邻接矩阵;将所述邻接矩阵转化为超链接矩阵;根据所述超链接矩阵,为所述服务器的预设PageRank模型训练器选取初始参数;根据所述初始参数,通过所述预设PageRank模型训练器计 ...
【技术保护点】
一种信息推荐方法,其特征在于,包括:根据所述服务器的行为日志数据库中的行为日志,生成邻接矩阵;将所述邻接矩阵转化为超链接矩阵;根据所述超链接矩阵,为所述服务器的预设PageRank模型训练器选取初始参数;根据所述初始参数,通过所述预设PageRank模型训练器计算PageRank向量,并记录迭代次数;按照从高到低的方式输出迭代后的所述PageRank向量;其中,所述预设PageRank模型训练器的计算公式为:PR(A)=[1-nΣi=1nC(Ti)·α]1N+nΣi=1nC(Ti)·αΣi=1nPR(Ti)C(Ti)]]>其中,PR(A)为被推荐的用户A的所述PageRank向量,n为推荐所述用户A的所有用户的总数,N为涉及到推荐行为的总人数,Ti是推荐所述用户A的任一用户,C(Ti)表示所述任一用户Ti推荐其他用户的总次数,PR(Ti)为所述任一用户Ti的所述PageRank向量,i=1,2,...,n。
【技术特征摘要】
1.一种信息推荐方法,其特征在于,包括:
根据所述服务器的行为日志数据库中的行为日志,生成邻接矩阵;
将所述邻接矩阵转化为超链接矩阵;
根据所述超链接矩阵,为所述服务器的预设PageRank模型训练器选
取初始参数;
根据所述初始参数,通过所述预设PageRank模型训练器计算
PageRank向量,并记录迭代次数;
按照从高到低的方式输出迭代后的所述PageRank向量;其中,
所述预设PageRank模型训练器的计算公式为:
PR ( A ) = [ 1 - n Σ i = 1 n C ( T i ) · α ] 1 N + n Σ i = 1 n C ( T i ) · α Σ i = 1 n PR ( T i ) C ( T i ) ]]>其中,PR(A)为被推荐的用户A的所述PageRank向量,n为推荐
所述用户A的所有用户的总数,N为涉及到推荐行为的总人数,Ti是推荐
所述用户A的任一用户,C(Ti)表示所述任一用户Ti推荐其他用户的总
次数,PR(Ti)为所述任一用户Ti的所述PageRank向量,i=1,2,...,n。
2.根据权利要求1所述的信息推荐方法,其特征在于,所述根据所
述服务器的行为日志数据库中的行为日志,生成邻接矩阵,具体包括:
从所述行为日志数据库中的所述行为日志中提取所有推荐信息,以所
述服务器的每个用户为节点,以推荐业务的使用者为起点,并以被推荐的
用户为终点建立边,以推荐的次数为所述边的权值,建立一个有向加权图;
将所述有向加权图存储在所述邻接矩阵中。
3.根据权利要求2所述的信息推荐方法,其特征在于,所述将所述
邻接矩阵转化为超链接矩阵,具体包括:
将所述有向加权图转化为所述超链接矩阵,其中,进行转化的计算公
式为:
H ( i , j ) = Adj ( i , j ) colSum ( i ) , when . . colSum ( i ) ! = 0 1 n , otherwise . ]]>其中,H(i,j)为所述超链接矩阵,i为所述任一用户,colSum(i)
为所述邻接矩阵中的所述任一用户推荐所述其他用户的总次数,n为涉及
到所述推荐行为的总人数。
4.根据权利要求1至3中任一项所述的信息推荐方法,其特征在于,
在所述通过所述预设PageRank模型训练器计算PageRank向量,并记录迭
代次数之后,包括:
判断所述迭代次数是否超过预定迭代次数阈值,并判断所述
PageRank向量与原所述PageRank向量是否超出预定迭代精度;
当判断结果都为是时,继续通过所述预设PageRank模型训练器进行
迭代操作,否则,按照从高到低的方式输出迭代后的所述PageRank向量。
5.根据权利要求4所述的信息推荐方法,其特征在于,所述初始参
数包括迭代向量、随机跳转因子、所述预定迭代精度和所述预定迭代次数
阈值。
6.一种信息推...
【专利技术属性】
技术研发人员:黄通文,张俊林,
申请(专利权)人:畅捷通信息技术股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。