具有多个辅助域的跨域推荐数据处理方法、跨域推荐系统技术方案

技术编号:21036697 阅读:116 留言:0更新日期:2019-05-04 06:17
本发明专利技术属于电子商务信息处理技术领域,公开了一种具有多个辅助域的跨域推荐数据处理方法、跨域推荐数据处理系统;获取辅助域的评分矩阵,计算用户的评分可靠性,等比例分段映射阈值,将辅助域中评分数量低于阈值的评分清空;使用K‑means聚类算法得到所有域的聚类级评分矩阵,进行矩阵分解;同时分解目标域评分矩阵,为冷启动用户学习特征映射函数;使用平均绝对误差来评估预测到的评分矩阵。与现有技术相比,本发明专利技术在数据处理的过程当中使用K‑means聚类算法得到联合所有域的聚类级的用户‑项目评分矩阵,降低了冷启动用户的数据稀疏性;缓解了传统单个辅助域矩阵分解模型预测准确度不佳而造成推荐效果不理想的问题,提升推荐系统的推荐效果,而且更具有通用性。

Cross-domain Recommendation Data Processing Method and Cross-domain Recommendation System with Multiple Auxiliary Domains

【技术实现步骤摘要】
具有多个辅助域的跨域推荐数据处理方法、跨域推荐系统
本专利技术属于电子商务信息处理
,尤其涉及一种具有多个辅助域的跨域推荐数据处理方法、跨域推荐数据处理系统。
技术介绍
目前,业内常用的现有技术是这样的:随着互联网技术和Web技术的高速发展,电子商务成为一种新的商务活动形式,越来越多的消费者愿意通过网络购买自己需要的商品。通过线上购物的方式,消费者可以浏览各种各样的商品;相对于传统的线下购物方式,线上购物使消费者拥有更多的选择权。但是另一方面,网络上各类信息更新速度之快,又使消费者很容易迷失在种类繁多的“产品海洋”中。在给消费者带来诸多便利的同时,“信息过载”问题随之而来,互联网上的消费者很难找到自己需要的信息。为了帮助消费者找到他们真正需要的商品,提高消费者的购物体验,推荐系统成为电子商务应用中不可或缺的一部分。推荐系统作为一种有效的消息过滤手段,是当前解决信息过载问题及实现个性化信息服务的有效方法之一。一般来说,内容过滤和协同过滤是推荐系统中最基本的两种推荐策略。其中内容过滤往往需要搜集一些外部信息,比如产品的特性、用户的特征等等,而这些信息有时并不容易甚至无法获得。协同过本文档来自技高网...

【技术保护点】
1.一种具有多个辅助域的跨域推荐数据处理方法,其特征在于,所述具有多个辅助域的跨域推荐数据处理方法包括以下步骤:步骤一,获取辅助域的评分矩阵,计算用户的评分可靠性,等比例分段映射阈值,将辅助域中评分数量低于阈值的评分清空;步骤二,使用K‑means聚类算法得到所有域的聚类级评分矩阵,进行矩阵分解;同时分解目标域评分矩阵,利用基于近邻的特征映射方法,为冷启动用户学习特征映射函数;步骤三,使用平均绝对误差来评估预测到的评分矩阵;如果推荐效果好于上一次,则将阈值加1;重新从预处理阶段的开始执行,直到目标域的推荐效果不再提高为止。

【技术特征摘要】
1.一种具有多个辅助域的跨域推荐数据处理方法,其特征在于,所述具有多个辅助域的跨域推荐数据处理方法包括以下步骤:步骤一,获取辅助域的评分矩阵,计算用户的评分可靠性,等比例分段映射阈值,将辅助域中评分数量低于阈值的评分清空;步骤二,使用K-means聚类算法得到所有域的聚类级评分矩阵,进行矩阵分解;同时分解目标域评分矩阵,利用基于近邻的特征映射方法,为冷启动用户学习特征映射函数;步骤三,使用平均绝对误差来评估预测到的评分矩阵;如果推荐效果好于上一次,则将阈值加1;重新从预处理阶段的开始执行,直到目标域的推荐效果不再提高为止。2.如权利要求1所述的具有多个辅助域的跨域推荐数据处理方法,其特征在于,所述步骤一具体包括:首先,获取辅助域中用户-项目评分矩阵;接着计算每个用户的评分可靠性并据此为每个用户个性化地设置阈值;然后将辅助域中项目的评分数量低于阈值的用户评分清空;最后,获取预处理后的辅助域中的用户-项目评分矩阵。3.如权利要求2所述的具有多个辅助域的跨域推荐数据处理方法,其特征在于,所述用户评分可靠性表示为:其中,Varu是用户对所有项目的评分与该项目评分的平均值的标准差;Nu为用户u评分过的项目的数量;rui为用户u对项目i的评分;为项目i的评分的平均值;由用户评分可靠性的计算公式可知,Varu的值越小,该用户的评分可靠性越高。4.如权利要求1所述的具有多个辅助域的跨域推荐数据处理方法,其特征在于,所述步骤二包括:对辅助域数据的处理、对目标域数据的处理以及从辅助域到目标域的知识迁移过程;对辅助域数据的处理,具体步骤如下:步骤一:采用偏置矩阵分解,将评分矩阵R映射到低维度的潜在空间和其中R=PQT;步骤二:将K-means聚类算法应用于用户潜在空间P和项目潜在空间Q,使得用户和项目分类到不同的聚类中;某类用户对某类项目的聚类级评分矩阵Rc的表示为:的表达式为:的表达式为:是第j个域中的第u个用户聚类,是第j'个域中的第i个项目聚类;是聚类用户评分过的聚类项目的数量;是聚类用户评分过的聚类项目的评分;对目标域数据的处理,首先对目标域的用户-项目评分矩阵进行分解,并将用户之间评分行为的相似度整合到传统的矩阵分解过程中。5.如权利要求4所述的具有多个辅助域的跨域推荐数据处理方法,其特征在于,所述用户评分行为相似度的计算包含三个方面:...

【专利技术属性】
技术研发人员:乔慧沈玉龙董学文姜晓鸿佟威刘洋洋马诗洋谷鑫雨杨凌霄赵六顺
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1