基于增强回归树的推荐方法及系统技术方案

技术编号:12218253 阅读:40 留言:0更新日期:2015-10-21 20:05
一种基于增强回归树的推荐方法,其包括如下步骤:S1、从在线服务商处获取用户对物品的评分记录,其中评分记录为评分矩阵R,在评分矩阵R中的每一个元素ri,j表示用户i对物品j的评分;在用户i没有对物品j评分时,指示矩阵I中的元素Ii,j=0,在用户i对物品j做出评分时,Ii,j=1;S2、学习用户的偏好模型{brti}及物品特征矩阵V;S3、根据学习用户的偏好模型{brti}及物品特征矩阵V的学习结果生成通过增强回归树表达的物品推荐列表。本发明专利技术还提供一种基于增强回归树的推荐系统。

【技术实现步骤摘要】

本专利技术涉及服务信息推送
,特别涉及一种基于增强回归树的推荐方法及 系统。
技术介绍
当前,网络服务商为用户提供了诸如新闻、商品、图片、视频、音频、文档等(以下 统一简称为物品)的在线服务。为了更好的为用户提供服务,服务商会记录用户的历史行 为,例如记录用户购买(使用)过哪些物品、对物品的评价等。用户对物品的评分是分析用 户偏好的重要信息。用户对物品的评分一般为1~k的整数,1表示最不喜欢,k表示最喜 欢。1~k之间的评分表示的喜欢程度依次递增。由于每一个用户消费的物品数量有限,如 何根据有限的评分数据挖掘用户偏好,进而据此为用户提供推荐是推荐领域面临的重要问 题。所谓推荐即是预测用户可能喜欢的物品、按照可能的喜欢程度排序,并把这个物品列表 推荐给用户。 在基于评分的推荐系统中,用户的偏好通常表示为一种线性函数。然而,由于用户 与用户之间的差异非常大,简单的线性函数难以准确的表示各种用户偏好,特别是用户表 现出来的条件偏好,难以用线性函数表示。所谓条件偏好指的是用户在不同条件下表现出 来的不同偏好。例如,天气寒冷时喜欢热的饮料,而在夏天则偏爱冷饮。研宄表明,条件偏 好是一种非线性的关系。传统的推荐方法忽略了用户偏好的条件性,造成了一定程度的推 荐错误。
技术实现思路
为了解决现有的商品或者服务推荐方法忽略了用户偏好的条件性,容易造成推荐 错误的缺陷,本专利技术提供一种基于增强回归树的推荐方法及系统。 一种基于增强回归树的推荐方法,其包括如下步骤: S1、从在线服务商处获取用户对物品的评分记录,其中评分记录为评分矩阵R,在 评分矩阵R中的每一个元素ru表示用户i对物品j的评分;在用户i没有对物品j评分 时,指示矩阵I中的元素Ii,j= 〇,在用户i对物品j作出评分时,I i,j= 1 ; S2、根据评分记录学习用户的偏好模型{bi%}及物品特征矩阵V ; S3、根据学习用户的偏好模型{brtj及物品特征矩阵V的学习结果生成通过增强 回归树表达的物品推荐列表。 一种基于增强回归树的推荐系统,其包括如下单元: 信息收集模块,用于从在线服务商处获取用户对物品的评分记录,其中评分记录 为评分矩阵R,在评分矩阵R中的每一个元素ru表示用户i对物品j的评分;在用户i没 有对物品j评分时,指示矩阵I中的元素I i;j= 〇,在用户i对物品j做出评分时,I i,j= 1 ; 学习模块,用于根据评分记录学习用户的偏好模型{brtj及物品特征矩阵V ; 列表生成模块,用于根据学习用户的偏好模型{brtj及物品特征矩阵V的学习结 果生成通过增强回归树表达的物品推荐列表。 本专利技术提供的基于增强回归树的推荐方法及系统,通过用增强回归树(Boosted Regression Trees)来表示用户的偏好,可以准确地表示用户的复杂偏好,从而得到更令人 满意的推荐结果。【附图说明】 图1是本专利技术实施的基于增强回归树的推荐方法流程图; 图2是本专利技术实施的基于增强回归树的推荐系统的结构框图; 图3是图2中学习模块的结构框图。【具体实施方式】 如图1所示,一种基于增强回归树的推荐方法,其包括如下步骤: S1、从在线服务商处获取用户对物品的评分记录,其中评分记录为评分矩阵R,在 评分矩阵R中的每一个元素ru表示用户i对物品j的评分;在用户i没有对物品j评分 时,指示矩阵I中的元素Ii;j= 〇,在用户i对物品j做出评分时,I i,j= 1。评分可以表示 为1~k的整数,1表示最不喜欢,k为正整数,表示最喜欢。1~k之间的评分表示的喜欢 程度依次递增。 S2、根据评分记录学习用户的偏好模型{brtj及物品特征矩阵V。 S3、根据学习用户的偏好模型{brtj及物品特征矩阵V的学习结果生成通过增强 回归树表达的物品推荐列表。增强回归树(Boosted Regression Trees)。 可选地,所述步骤S2包括如下子步骤: S21、随机生成物品特征矩阵V中的每一个元素;对用户i,计算该用户所有评分的 均值,作为初始的回归树T i;(l加入用户i的偏好模型brt i中; S22、检查收敛条件,当迭代次数达到预设次数或目标函数的值不再减小时跳转到 步骤S23,否则跳转到步骤S3; 目标函数为如下: 其中,L为预测的用户评分,|卜| I# F-范数,A v为正规化项的权重; S23、采用gradient boost算法为每一个用户i训练一个回归树凡』;针对用户i 的每一个评分R」计算:L ;采用{(1,^)}作为训练样本,训练回归树Tu; 将Ti>k以gradient boost算法的学习率n加入到brti*,其中brti-brti+nTu; gradient boost算法为梯度提升算法。 S24、更新每一个物品j的物品特征向量。 可选地,所述步骤S23中: gradient boost算法的学习率n的值为〇. 01。n用于表示用户偏好模型学习过 程的收敛速度 可选地,所述步骤S22中: 正规化项的权重入v= 0? 001。 可选地,所述步骤S24包括如下子步骤: S241、判断是否收敛:收敛条件为目标函数的值不再减小;如果满足收敛条件则 结束更新物品j的物品特征向量否则执行步骤S242。 S242、计算并更新物品j的物品特征向量'中每一维的最优值:第d维的元素vj;d, 计算最优值的方法如下: 从所有评价了物品j的用户的偏好模型{brtj中找到所有关于第d维变量的分 支点,并按照从小到大排序,记为( Sl,s2,...);候选值为相邻两个分支点的均值,记为C = {(Si+si+1)/2, i = 1,2,. . . },最优值就是C中使目标函数值最小的一个,即 S243、重复执行步骤S241以及步骤S242,直至更新完所有物品特征向量,并返回 步骤S22。 可选地,所述步骤S3包括: 对每一个用户i,计算该用户对所有没有评分的物品j的评分预测值,计算方法 为: ;对I按照从大到小排序,得到对用户i推荐列表。是用户i对物品j评分的估计值,Vj是1XD的行向量,表示了物品j的特征。 bi%是表示用户i的偏好的增强回归树模型。可选地,D的取值为不大于50的正整数。 可选地,表示用户i的偏好的增强回归树bi%是多个回归树的加权和: 其中,Ti;k是brh中的第k个回归树,ai;k是第k个回归树的权重,K是brh中回 归树的总数。可选地,K的取值为不大于50的正整数。 研宄表明,增强回归树模型能够完整的表示非线性的条件偏好,比线性函数或者 多项式函数有更强的表达能力。将增强回归树模型用于推荐系统能准确表示用户偏好,得 到更令人满意的推荐结果。 本专利技术提供的推荐方法在真实数据集Epinions和MovieLen上进行了验证。 Epinions和MovieLen是业内常用的检验推荐结果性能的数据集。以NDCG (Normalized Discounted Cumulative Gain)和ERR(Expected Reciprocal Rank)为检验标准,本发当前第1页1 2 本文档来自技高网...

【技术保护点】
一种基于增强回归树的推荐方法,其特征在于,其包括如下步骤:S1、从在线服务商处获取用户对物品的评分记录,其中评分记录为评分矩阵R,在评分矩阵R中的每一个元素ri,j表示用户i对物品j的评分;在用户i没有对物品j评分时,指示矩阵I中的元素Ii,j=0,在用户i对物品j做出评分时,Ii,j=1;S2、根据评分记录学习用户的偏好模型{brti}及物品特征矩阵V;S3、根据学习用户的偏好模型{brti}及物品特征矩阵V的学习结果生成通过增强回归树表达的物品推荐列表。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘俊涛邓德位吴汉宝张必银
申请(专利权)人:中国船舶重工集团公司第七零九研究所
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1