【技术实现步骤摘要】
本专利技术涉及推荐
,特别涉及一种基于线性回归的推荐方法及系统。
技术介绍
随着互联网技术的迅猛发展,大数据已然降临。形如社交网络、电子商务和移动通信的发展使人们摆脱了信息匮乏的境况,进入了以千万亿字节(PateByte,PB)为单位的海量数据时代。新浪微博的日活跃用户超过6千万,日均发布微博数量已经增至1.3亿条;百度日处理查询量超十亿次;淘宝“双十一”单日交易量则高达1.7亿次。随着数据爆炸式的增长,问题也随之而来:如何从庞大的数据量中挖掘出对自身最有价值信息,实现信息与用户的最佳匹配?这无论对于信息消费者,还是服务提供者都是严峻的挑战。针对上述问题,推荐系统提供了一个很好的解决方案。作为21世纪非常有潜力的信息过滤技术之一,推荐系统通过分析历史数据,建立相应的数学模型,挖掘其中的隐含信息,从而为用户提供个性化的推荐服务,成功实现了信息的最佳匹配。它一方面满足了用户的信息需求,另一方面拓展了信息的潜在价值,实现了信息消费者与生 ...
【技术保护点】
一种基于线性回归的推荐方法及系统,其特征是所述方法包括:步骤1:遍历当前网络系统中的所有用户和物品,获得所有用户和物品的历史评分数据;步骤2:根据历史评分数据建立基于用户的线性回归模型;步骤3:根据历史评分数据建立基于物品的线性回归模型;步骤4:利用用户和物品的线性回归模型预测用户对未评过分的物品的评分;步骤5:根据用户对所有未评过物品的预测评分排序,将排名较高的物品作为候选推荐给用户。
【技术特征摘要】
1.一种基于线性回归的推荐方法及系统,其特征是所述方法包括:
步骤1:遍历当前网络系统中的所有用户和物品,获得所有用户和物品
的历史评分数据;
步骤2:根据历史评分数据建立基于用户的线性回归模型;
步骤3:根据历史评分数据建立基于物品的线性回归模型;
步骤4:利用用户和物品的线性回归模型预测用户对未评过分的物品的
评分;
步骤5:根据用户对所有未评过物品的预测评分排序,将排名较高的物
品作为候选推荐给用户。
2.根据权利要求1所述的一种基于线性回归的推荐方法及系统,其特
征是所述根据历史评分数据建立基于用户的线性回归模型具体包括:
步骤21:对于每个用户,将该用户对其所评过的物品的历史评分构成
一个N维向量Yu,其中N为该用户的评过的物品个数;
步骤22:按照向量Yu中物品的顺序,统计该用户评过分的每个物品的
历史评分中出现频次最高的评分,并将结果构成一个N维向量Xu;
步骤23:假设Xu与Yu之间有如下关系:
Yu=auXu+bu利用上述N维向量对此式进行线性回归,利用最小二乘法估计出模型
参数au与bu的值。
3.根据权利要求1所述的一种基于线性回归的推荐方法及系统,其特
征是所述根据历史评分数据建立基于物品的线性回归模型具体包括:
步...
【专利技术属性】
技术研发人员:陈震,谢峰,冯喜伟,尚家兴,曹军威,
申请(专利权)人:清华大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。