【技术实现步骤摘要】
本专利技术涉及互联网
,特别是涉及一种信息推荐方法和系统。
技术介绍
现在的互联网网站中,常见的信息推荐方案可以分为两种:基于内容的和基于行为的。前者在新闻、电影等类型的信息推荐中比较常用,而在以特定对象为推荐的一类网站中中,一般只能作为辅助、补充的方法。由于网站的浏览量巨大、用户群众多,每天都有大量的用户行为数据积累下来。当前最常见的基于行为的推荐算法,是协同过滤及各种衍生版本。其核心是根据用户与特定对象执行的行为数据,在用户空间中计算特定对象之间的相似度,从而根据特定对象来推荐其他对象;或者在对象空间中计算用户的相似度,然后计算出相似用户有过行为的特定对象,来推荐给当前用户。前面所述的计算方法,数据稀疏性比较严重,计算量非常大,算法效率的提升容易遇到瓶颈。由于要计算所有用户和所有对象,数据容易掺进杂质,降低结果的准确率。由于需要推荐的对象和用户数都非常巨大,通常达到百万、千万以上的级别。这样,在计算对象相似度或者用户相似度时,数据稀疏性比较严重。另一方面,更多的长尾用户的网上行为,是零星的、没有规律性的,在推荐流程中,只会增加时间复杂度,而不会对计算的效果有所提高。由此可见,传统方法统计用户行为和数据,涉及过多的用户和对象。正如签名所述,包含较多用户的行为是不具有规律性、可参考性的,经过推荐流程后,包含有较多也并不是作为优先对象所希望选择的;这些用户和对象对最终的推荐效果,并没有太大的正 ...
【技术保护点】
一种信息推荐方法,其特征在于,包括如下步骤:根据数据库中保存的用户行为数据,建立用户到待推荐的对象的m×n矩阵A,根据矩阵A的元素Aij确定每个用户对每个对象的行为权值;其中,m为用户数量,n为对象数量,矩阵A的元素满足:A_(ik)>A_(jk),k为同一对象,用户i对对象的行为比用户j更早产生;A_(ik)=0,用户i对对象k没有行为;建立m维的用户权值向量E和n维的对象质量向量Q,并将两个向量的所有元素都初始化为1;其中,E表示用户的优先级权值,Q表示对象的质量权值;将用户权值向量E和n维的对象质量向量Q进行迭代运算:E:=Q×ATQ:=E×A其中,AT为矩阵A的转置矩阵;将用户权值向量E的各个元素对应的用户和对象质量向量Q的各个元素对应的对象分别按照权值排序;依顺序提取前面比例为a(a<1)的权值的用户设为优先用户,依顺序提取前面比例为a的权值的对象设为高质对象;根据所述优先用户和高质对象,采用基于对象的协同过滤方法或基于用户的协同过滤方法进行对象信息的推荐。
【技术特征摘要】
1.一种信息推荐方法,其特征在于,包括如下步骤:
根据数据库中保存的用户行为数据,建立用户到待推荐的对象的m×n矩阵
A,根据矩阵A的元素Aij确定每个用户对每个对象的行为权值;
其中,m为用户数量,n为对象数量,矩阵A的元素满足:
A_(ik)>A_(jk),k为同一对象,用户i对对象的行为比用户j更早产生;
A_(ik)=0,用户i对对象k没有行为;
建立m维的用户权值向量E和n维的对象质量向量Q,并将两个向量的所
有元素都初始化为1;其中,E表示用户的优先级权值,Q表示对象的质量权值;
将用户权值向量E和n维的对象质量向量Q进行迭代运算...
【专利技术属性】
技术研发人员:王迎宾,
申请(专利权)人:广州品唯软件有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。