The invention discloses a recommended method of clustering PU matrix decomposition based, including decomposition method training model using PU matrix clustering step, recommended steps for the user or the user characteristic data or commodity goods: first collect the existing, according to the construction of two value relation matrix of user behavior of the goods, the value of two only in cases of positive relation matrix was observed, the definition of learning model decomposition method based on PU matrix clustering, recommendation algorithm training model; finally in the recommendation, prediction of users and commodities with trained, have predictive value, according to the predicted value from high to low for the user or the goods are recommended.
【技术实现步骤摘要】
一种基于聚类PU矩阵分解的个性化推荐方法
本专利技术提供一种基于聚类PU矩阵分解的个性化推荐方法,涉及个性化推荐领域的矩阵分解算法,特别适用于关系矩阵中只有正例被观察到的推荐系统问题。
技术介绍
目前,个性化推荐技术已广泛运用于互联网的各方面,例如著名的电商平台Amazon,会根据用户的浏览、点击、购买、评价历史数据,推荐用户可能感兴趣的其他商品;著名的电影视频网站Netflix会根据用户对已看电影的评分判断出用户对哪些类型的电影感兴趣,然后推荐合适的电影给用户。一种主流的个性化推荐算法,是根据用户群对商品集的评分记录,得到评分矩阵,也称关系矩阵,然后使用机器学习技术,对缺失的值填补,将预测值较大的商品推荐给用户。大多情形下,用户对商品的评分由低到高有很多值,但也有很多情形,用户对商品只有喜欢或不喜欢的表达,如果仅知道用户喜欢哪些商品,则关系矩阵中只有正例元素被观察到,其他均为非标记元素。传统的推荐算法并不适用上述情形。随着数据收集和处理能力的增强,有更多的用户或商品的特征会被收集和使用。传统的个性化推荐算法浪费了很多有用的用户或商品的辅助特征信息,本专利技术考虑采用带辅助特征信息的归纳式矩阵补全方法提升推荐效果,同时也可考虑使相似的用户或商品的推荐结果尽量接近,将聚类的思想融入到模型中。
技术实现思路
专利技术目的:目前的个性化推荐往往只考虑用户商品的多值关系,忽略了用户和商品之间往往只存在二值关系并且只有正向关系被观察到,此外通常忽略了相似用户和商品之间的联系,不具有普适性。针对上述问题,本专利技术提供了一种基于聚类PU(P为正样本,U为未标记样本)矩阵分 ...
【技术保护点】
一种基于聚类PU矩阵分解的个性化推荐方法,其特征在于:包括使用聚类PU矩阵分解方法训练的步骤,对用户或商品进行推荐的步骤;所述使用聚类PU矩阵分解方法训练的具体步骤为:步骤100,输入用户与商品的行为数据至数据处理平台;步骤101,若存在用户或商品各自的特征数据,则输入作为关系矩阵的辅助特征信息;步骤102,对特征数据进行预处理,去除噪声影响,同时进行数据正规化处理;步骤103,定义用户和商品的关系标签,若某用户与某商品有关联,则定义为正向关系,标记为“1”,否则该用户与该商品关系未知,标记为“0”;标记完成后得到二值关系矩阵A;步骤104,初始化聚类数k、正负样本损失权重c、正则项系数λ1、聚类项系数λ2等模型参数;步骤105,在数据处理平台上,使用聚类PU矩阵分解方法训练模型,得到两个参数矩阵W,H;步骤106,输出并保存模型W,H至数据处理平台的存储系统。
【技术特征摘要】
1.一种基于聚类PU矩阵分解的个性化推荐方法,其特征在于:包括使用聚类PU矩阵分解方法训练的步骤,对用户或商品进行推荐的步骤;所述使用聚类PU矩阵分解方法训练的具体步骤为:步骤100,输入用户与商品的行为数据至数据处理平台;步骤101,若存在用户或商品各自的特征数据,则输入作为关系矩阵的辅助特征信息;步骤102,对特征数据进行预处理,去除噪声影响,同时进行数据正规化处理;步骤103,定义用户和商品的关系标签,若某用户与某商品有关联,则定义为正向关系,标记为“1”,否则该用户与该商品关系未知,标记为“0”;标记完成后得到二值关系矩阵A;步骤104,初始化聚类数k、正负样本损失权重c、正则项系数λ1、聚类项系数λ2等模型参数;步骤105,在数据处理平台上,使用聚类PU矩阵分解方法训练模型,得到两个参数矩阵W,H;步骤106,输出并保存模型W,H至数据处理平台的存储系统。2.如权利要求1所述的基于聚类PU矩阵分解的个性化推荐方法,其特征在于:对用户或商品进行推荐的具体步骤为:步骤200,判断是否需要对新用户或新商品进行推荐,如果是则获取新用户或商品的特征数据;否则取出已有用户或商品的特征数据;步骤201,判断是否利用辅助特征信息,若是则用特征信息矩阵V与训练得到的参数矩阵W,H相乘得到预测值矩阵M=WHTVT;否则直接相乘W,H得到预测值矩阵M=WHT;步骤202,将预测值矩阵M中的元素,按数值...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。