信息推荐方法和系统技术方案

技术编号:10075510 阅读:197 留言:0更新日期:2014-05-24 05:12
本发明专利技术提供一种信息推荐方法和系统。首先生成用户-对象矩阵,然后建立用户权值向量和对象质量向量,再通过迭代算法计算出用户的优先级权值和对象的质量权值,分别按照权值排序提取用于推荐计算的优先用户高质对象,既剔除了对推荐计算结果影响较小的数据,减少了数据计算量,又能避免无用数据的影响,提高推荐计算的结果的精确度;综合来看,该方案能够明显提高服务器资源利用率,降低推荐计算的时间消耗,提高了信息推荐的效果和效率,更有利于信息推荐的实时化。

【技术实现步骤摘要】

本专利技术涉及互联网
,特别是涉及一种信息推荐方法和系统
技术介绍
现在的互联网网站中,常见的信息推荐方案可以分为两种:基于内容的和基于行为的。前者在新闻、电影等类型的信息推荐中比较常用,而在以特定对象为推荐的一类网站中中,一般只能作为辅助、补充的方法。由于网站的浏览量巨大、用户群众多,每天都有大量的用户行为数据积累下来。当前最常见的基于行为的推荐算法,是协同过滤及各种衍生版本。其核心是根据用户与特定对象执行的行为数据,在用户空间中计算特定对象之间的相似度,从而根据特定对象来推荐其他对象;或者在对象空间中计算用户的相似度,然后计算出相似用户有过行为的特定对象,来推荐给当前用户。前面所述的计算方法,数据稀疏性比较严重,计算量非常大,算法效率的提升容易遇到瓶颈。由于要计算所有用户和所有对象,数据容易掺进杂质,降低结果的准确率。由于需要推荐的对象和用户数都非常巨大,通常达到百万、千万以上的级别。这样,在计算对象相似度或者用户相似度时,数据稀疏性比较严重。另一方面,更多的长尾用户的网上行为,是零星的、没有规律性的,在推荐流程中,只会增加时间复杂度,而不会对计算的效果有所提高。由此可见,传统方法统计用户行为和数据,涉及过多的用户和对象。正如签名所述,包含较多用户的行为是不具有规律性、可参考性的,经过推荐流程后,包含有较多也并不是作为优先对象所希望选择的;这些用户和对象对最终的推荐效果,并没有太大的正面影响;但在进行推荐流程的技术时,却仍然将其包含到技术范围内,这就明显浪费服务器资源,后续推荐计算的时间消耗多,既降低了推荐的效果,又降低了推荐的效率,阻碍了信息推荐的实时化。
技术实现思路
基于此,有必要针对现有技术中存在的后续推荐计算的时间消耗多,推荐的效果差和推荐效率低的问题,提供一种信息推荐方法和系统。一种信息推荐方法,包括如下步骤:根据数据库中保存的用户行为数据,建立用户到待推荐的对象的m×n矩阵A,根据矩阵A的元素Aij确定每个用户对每个对象的行为权值;其中,m为用户数量,n为对象数量;矩阵A的元素满足:A_(ik)>A_(jk),k为同一对象,用户i对对象的行为比用户j更早产生;A_(ik)=0,用户i对对象k没有行为;建立m维的用户权值向量E和n维的对象质量向量Q,并将两个向量的所有元素都初始化为1,其中,E表示用户的优先级权值,Q表示对象的质量权值;将用户权值向量E和n维的对象质量向量Q进行迭代运算:E:=Q×ATQ:=E×A其中,AT为矩阵A的转置矩阵;将用户权值向量E的各个元素对应的用户和对象质量向量Q的各个元素对应的对象分别按照权值排序;依顺序提取前面比例为a(a<1)的权值的用户设为优先用户,依顺序提取前面比例为a的权值的对象设为高质对象;根据所述优先用户和高质对象,采用基于对象的协同过滤方法或基于用户的协同过滤方法进行对象信息的推荐。一种信息推荐系统,包括:矩阵生成模块,用于根据数据库中保存的用户行为数据,建立用户到待推荐的对象的m×n矩阵A,根据矩阵A的元素Aij确定每个用户对每个对象的行为权值;其中,m为用户数量,n为对象数量;矩阵A的元素满足:A_(ik)>A_(jk),k为同一对象,用户i对对象的行为比用户j更早产生;A_(ik)=0,用户i对对象k没有行为;向量生成模块,用于建立m维的用户权值向量E和n维的对象质量向量Q,并将两个向量的所有元素都初始化为1,其中,E表示用户的优先级权值,Q表示对象的质量权值;将用户权值向量E和n维的对象质量向量Q进行迭代运算:E:=Q×ATQ:=E×A其中,AT为矩阵A的转置矩阵;用户和对象提取模块,用于将用户权值向量E的各个元素对应的用户和对象质量向量Q的各个元素对应的对象分别按照权值排序;依顺序提取前面比例为a(a<1)的权值的用户设为优先用户,依顺序提取前面比例为a的权值的对象设为高质对象;信息推荐模块,用于根据所述优先用户和高质对象,采用基于对象的协同过滤方法或基于用户的协同过滤方法进行对象信息的推荐。上述信息推荐方法和系统。首先生成用户-对象矩阵,然后建立用户权值向量和对象质量向量,再通过迭代算法计算出用户的优先级权值和质量权值,分别按照权值排序提取用于推荐计算的优先用户高质对象,既剔除了对推荐计算结果影响较小的数据,减少了数据计算量,又能避免无用数据的影响,提高推荐计算的结果的精确度;综合来看,该方案能够明显提高服务器资源利用率,降低推荐计算的时间消耗,提高了信息推荐的效果和效率,更有利于信息推荐的实时化。附图说明图1为本专利技术的信息推荐方法流程图;图2为本专利技术的信息推荐系统结构示意图。具体实施方式下面结合附图对本专利技术的信息推荐方法和系统的具体实施方式作详细描述。参考图1所示,图1为本专利技术的信息推荐方法流程图,主要包括如下步骤:步骤S10,根据数据库中保存的用户行为数据,建立用户到待推荐的对象的m×n矩阵A,根据矩阵A的元素Aij确定每个用户对每个对象的行为权值;其中,m为用户数量,n为对象数量;矩阵A的元素满足:A_(ik)>A_(jk),k为同一对象,用户i对对象的行为比用户j更早产生;A_(ik)=0,用户i对对象k没有行为。m×n矩阵A可以表示如下:在一个实施例中,对于根据矩阵A的元素Aij确定每个用户对每个对象的行为权值的过程,具体可以包括如下:步骤S101,建立用户的行为数据集合R;R={(u,p,t)本文档来自技高网
...
信息推荐方法和系统

【技术保护点】
一种信息推荐方法,其特征在于,包括如下步骤:根据数据库中保存的用户行为数据,建立用户到待推荐的对象的m×n矩阵A,根据矩阵A的元素Aij确定每个用户对每个对象的行为权值;其中,m为用户数量,n为对象数量,矩阵A的元素满足:A_(ik)>A_(jk),k为同一对象,用户i对对象的行为比用户j更早产生;A_(ik)=0,用户i对对象k没有行为;建立m维的用户权值向量E和n维的对象质量向量Q,并将两个向量的所有元素都初始化为1;其中,E表示用户的优先级权值,Q表示对象的质量权值;将用户权值向量E和n维的对象质量向量Q进行迭代运算:E:=Q×ATQ:=E×A其中,AT为矩阵A的转置矩阵;将用户权值向量E的各个元素对应的用户和对象质量向量Q的各个元素对应的对象分别按照权值排序;依顺序提取前面比例为a(a<1)的权值的用户设为优先用户,依顺序提取前面比例为a的权值的对象设为高质对象;根据所述优先用户和高质对象,采用基于对象的协同过滤方法或基于用户的协同过滤方法进行对象信息的推荐。

【技术特征摘要】
1.一种信息推荐方法,其特征在于,包括如下步骤:
根据数据库中保存的用户行为数据,建立用户到待推荐的对象的m×n矩阵
A,根据矩阵A的元素Aij确定每个用户对每个对象的行为权值;
其中,m为用户数量,n为对象数量,矩阵A的元素满足:
A_(ik)>A_(jk),k为同一对象,用户i对对象的行为比用户j更早产生;
A_(ik)=0,用户i对对象k没有行为;
建立m维的用户权值向量E和n维的对象质量向量Q,并将两个向量的所
有元素都初始化为1;其中,E表示用户的优先级权值,Q表示对象的质量权值;
将用户权值向量E和n维的对象质量向量Q进行迭代运算...

【专利技术属性】
技术研发人员:王迎宾
申请(专利权)人:广州品唯软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1