一种基于矩阵分解的产品推荐方法技术

技术编号：20845257 阅读：20 留言：0更新日期：2019-04-13 09:01

本发明专利技术公开了一种基于矩阵分解的产品推荐方法，包括：(1)对历史评分数据进行预处理，得到用户对产品的评分矩阵；(2)对评分矩阵中同一用户对不同产品的喜好程度进行排序，并根据排序结果确定损失函数；(3)对评分矩进行分解，并根据损失函数对分解结果进行调整，从而得到使得损失函数取值最小的第一特征向量和第二特征向量，由此完成矩阵分解并得到向用户推荐产品的推荐列表。本发明专利技术所提供的基于矩阵分解的产品推荐方法，在确定损失函数时，将同一用户对不同产品的喜好程度的排序关系考虑在内，能够在损失函数中更为充分地体现用户与被推荐产品之间的复杂关系，从而有效提高产品推荐的准确度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于矩阵分解的产品推荐方法
本专利技术属于数据挖掘和个性化推荐领域，更具体地，涉及一种基于矩阵分解的产品推荐方法。
技术介绍
根据用户对产品的喜好程度向用户推荐产品时，常用的方法包括协同过滤法和矩阵分解法。协同分解法又分为基于用户的协同过滤法和基于产品的协同过滤方法，前者利用不同用户之间的相似度来向用户推荐产品，后者则利用产品之间的相似度来向用户推荐产品，相似度之间的计算方式有多种，例如余弦相似度，Jaccard相似度等。在实际的使用中，基于用户的协同过滤协同方法主要使用在用户数远多于产品数的场景下，基于产品的协同过滤方法主要使用在产品数远多于用户数的场景下。协同过滤法适用于大数据应用场景，其计算量较大，不能做到实时地向用户推荐产品，基于模型的协同过滤算法有效的解决了这一问题，矩阵分解(MatrixFactorization,MF)法是基于模型的协同过滤算法中的一种。基于矩阵分解的传统推荐模型是将用于表示用户与产品关系的评分矩阵分解成用户矩阵和产品矩阵，用户矩阵用于表示用户与隐藏特征的关系，产品矩阵用于表示产品与隐藏特征的关系，隐藏特征可以理解为影响用户选择产品的因子，可以手动设置个数。分解形式为：R＝PQ。它是将用户产品关系矩阵R通过学习训练参数，最终可以得到两个分解矩阵P和Q，损失函数的定义如下所示。在上述损失函数中，rui为用户产品关系矩阵R中的元素，pu和qi分别为矩阵P和矩阵Q中的向量，λ为正则化系数。通过定义的损失函数，可以求得模型参数。损失函数是一个凸函数，凸函数必然存在最小值，这是一个凸优化问题，通过梯度下降法不断迭代，可求解出两个矩阵...

【技术保护点】
1.一种基于矩阵分解的产品推荐方法，其特征在于，包括如下步骤：(1)对历史评分数据进行预处理，得到用户对产品的评分矩阵；(2)对所述评分矩阵中同一用户对不同产品的喜好程度进行排序，并根据排序结果确定损失函数；(3)对所述评分矩进行分解，并根据所述损失函数对分解结果进行调整，从而得到使得所述损失函数取值最小的第一特征向量和第二特征向量，由此完成矩阵分解并得到向用户推荐产品的推荐列表；其中，所述第一特征向量用于表示用户与隐藏特征的关系，所述第二特征向量用于表示产品与隐藏特征的关系。

【技术特征摘要】
1.一种基于矩阵分解的产品推荐方法，其特征在于，包括如下步骤：(1)对历史评分数据进行预处理，得到用户对产品的评分矩阵；(2)对所述评分矩阵中同一用户对不同产品的喜好程度进行排序，并根据排序结果确定损失函数；(3)对所述评分矩进行分解，并根据所述损失函数对分解结果进行调整，从而得到使得所述损失函数取值最小的第一特征向量和第二特征向量，由此完成矩阵分解并得到向用户推荐产品的推荐列表；其中，所述第一特征向量用于表示用户与隐藏特征的关系，所述第二特征向量用于表示产品与隐藏特征的关系。2.如权利要求1所述的基于矩阵分解的产品推荐方法，其特征在于，所述步骤(1)包括：利用所述历史评分数据生成用户对产品的第一评分矩阵；若所述第一评分矩阵的规模大于预设的数据集阈值，则对所述第一评分矩阵进行降维操作，从而得到第二评分矩阵，并将所述第二评分矩阵作为所述评分矩阵；否则，将所述第一评分矩阵作为所述评分矩阵。3.如权利要求1或2所述的基于矩阵分解的产品推荐方法，其特征在于，所述步骤(2)包括：对于所述评分矩阵中的任意一个用户，若根据排序规则，该用户对第一产品的喜好程度大于该用户对第二产品的喜好程度，则由该用户、所述第一产品和所述第二产品构成一个有序三元组；计算每一个有序三元组中，用户对两个产品的评分差值，并对所述评分差值进行归一化后取其对数；将所有归一化评分差值的对数相加求和，作为迭代项；根据分解所得两个矩阵的矩阵范数构建第一正则化项；根据所述迭代项和所述第一正则化项确定所述损失函数；或者，获得任意两个用户之间的用户相似度以及任意两个产品之间的产品相似度，以构建第二正则化项，并根据所述迭代项、所述第一正则化项以及所述第二正则化项确定所述损失函数；其中，所述第一正则化项和所述第二正则化项均用于防止过拟合，所述排序规则为：对于所述评分矩阵中的任意一个用户u'，所述用户u'对于其评分过的所有产品喜好程度均相同，所述u'用户对于其未评分过的所有产品喜好程度均相同，并且所述用户u'对于其评分过的任意一个产品的喜好程度大于其未评分过的所有产品的喜好程度。4.如权利要求3所述的基于矩阵分解的产品推荐方法，其特征在于，根据所述迭代项和所述第一正则化项所确定的损失函数，其表达式为：其中，C1为损失函数，S为由所有有序三元组构成的集合，u为用户编号，i和j均为产品编号，P和Q分别表示由所述评分矩阵分解所得的用户矩阵和产品矩阵...

【专利技术属性】
技术研发人员：路松峰，吴旭，王穆，
申请(专利权)人：华中科技大学，
类型：发明
国别省市：湖北,42

全部详细技术资料下载我是这个专利的主人