【技术实现步骤摘要】
本专利技术涉及项目推荐方法,具体是一种结合用户评论内容和评分的项目推荐方法。
技术介绍
随着Web2.0以来,互联网上的信息以指数级的数量增长,面对海量的数据,用户明显感觉到很难从中发现自己真正感兴趣的内容,于是推荐系统变得越来越不可或缺。我们可以依靠推荐系统从音乐流媒体服务平台(例如网易云音乐)中收藏的上百万首歌曲中发现自己喜欢的歌曲;我们也可以依靠推荐系统从新闻网站(例如腾讯新闻)中发现自己感兴趣的新闻。淘宝等购物网站使用推荐系统向用户推荐他们可能喜欢的商品。虽然推荐系统在互联网的很多领域表现良好,但是现有的方法仍然存在不足之处。其中一个不足之处在于大多数推荐系统都不能很好的处理冷启动问题,冷启动问题指的是当推荐系统中存在新用户时,由于系统中缺少新用户足够的历史行为信息,这样就导致推荐系统不能很好的给新用户做出满意的推荐结果;同样,对于新项目推荐系统也不能及时的推荐给用户。冷启动问题在导致推荐系统对新用户和新项目的体验不好。另外一个问题是现有的推荐系统的可解释性差,它们不能更加深入地学习用户的偏好以及项目的属性。例如在矩阵分解方法中,我们学习对应用户潜在特征和项目潜在特征的两个特征向量。两个潜在特征向量的点积大小表示用户是否喜欢这个项目。但是这些潜在的特征值很难同用户真实的评价联系起来。例如一个用户可能喜欢某个项目由于两个特征向量的某个特征值同时对应的值比较大,当推荐系统给用户推荐这个项目时,很难用真实的物理意义解释说明给用户,做出相应推荐的原因。如果项目是一 部科幻题材的电影,是否意味着用户喜欢科幻电影或者用户仅仅因为喜欢电影的男主角而喜欢呢?我们 ...
【技术保护点】
一种结合用户评论内容和评分的项目推荐方法,其特征在于包括以下步骤:步骤1:从互联网中采集用户数据并对其进行预处理,生成用户行为数据存放到用户行为信息数据库;步骤2:通过分析用户的历史行为数据,构建用户对项目偏好评分以及评论的标签,并将数据划分为训练集和测试集;步骤3:基于训练集构建用户-项目的偏好评分矩阵;步骤4:利用训练集中用户对项目的评论内容构建LDA模型;步骤5:构建映射函数,使基于评分的矩阵分解方法和基于评论的LDA模型方法有效地联系起来;步骤6:通过设置一个超参数μ来平衡评分数据和评论数据对推荐的影响程度,得到推荐的模型表达式;步骤7:训练步骤6中得到的模型,利用测试集得到的不同的超参数μ中的推荐误差,绘制不同超参数μ得到的误差曲线;步骤8:从误差曲线中选择出最优的误差曲线对应的超参数μ,得到最优的预测推荐模型;步骤9:基于最优超参数μ,对推荐系统中出现的用户项目集,按照步骤8的模型对目标用户计算他对某个待推荐项目的评分,当评分大于设定的阈值时,系统就把该项目推荐给用户。
【技术特征摘要】
1.一种结合用户评论内容和评分的项目推荐方法,其特征在于包括以下步骤:步骤1:从互联网中采集用户数据并对其进行预处理,生成用户行为数据存放到用户行为信息数据库;步骤2:通过分析用户的历史行为数据,构建用户对项目偏好评分以及评论的标签,并将数据划分为训练集和测试集;步骤3:基于训练集构建用户-项目的偏好评分矩阵;步骤4:利用训练集中用户对项目的评论内容构建LDA模型;步骤5:构建映射函数,使基于评分的矩阵分解方法和基于评论的LDA模型方法有效地联系起来;步骤6:通过设置一个超参数μ来平衡评分数据和评论数据对推荐的影响程度,得到推荐的模型表达式;步骤7:训练步骤6中得到的模型,利用测试集得到的不同的超参数μ中的推荐误差,绘制不同超参数μ得到的误差曲线;步骤8:从误差曲线中选择出最优的误差曲线对应的超参数μ,得到最优的预测推荐模型;步骤9:基于最优超参数μ,对推荐系统中出现的用户项目集,按照步骤8的模型对目标用户计算他对某个待推荐项目的评分,当评分大于设定的阈值时,系统就把该项目推荐给用户。2.根据权利要求1所述的结合用户评论内容和评分的项目推荐方法,其特征在于:所述步骤1采集的数据至少包括用户唯一ID、项目唯一ID、用户对项目的评论内容、偏好评分以及...
【专利技术属性】
技术研发人员:黄文明,程广兵,邓珍荣,
申请(专利权)人:桂林电子科技大学,
类型:发明
国别省市:广西;45
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。