一种融合时间因素的用户偏好和距离加权的聚类方法技术

技术编号：20160454 阅读：30 留言：0更新日期：2019-01-19 00:13

一种融合时间因素的用户偏好和距离加权的聚类方法，通过引入由用户基本客观特征构造的用户—用户属性矩阵来缓解用户冷启动问题，而稀疏性问题的改进主要是通过引入项目特征，由于项目的特征可以从内容的方面来体现用户偏好，从而能够达到减少矩阵的维数；将项目特征引入到用户—项目评分来得到小维数的用户—项目属性总评分矩阵；用TF‑IDF算法构建用户—项目属性偏好矩阵时引入项目特征，同时考虑用户兴趣随时间漂移对用户偏好的影响；基于以上的三个矩阵来得到加权后欧氏距离，然后利用K‑Means算法进行聚类。本方法是以电影的推荐为例，在MovieLens数据集上进行的实验结果表明，与其他相关的算法相比，该方法具有较好的推荐质量和性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种融合时间因素的用户偏好和距离加权的聚类方法
本专利技术涉及个性化推荐算法，具体提供一种融合了时间因素的用户偏好和距离加权的聚类方法。
技术介绍
近年来，随着信息技术和Web2.0的发展，互联网的信息出现了前所未有的暴涨，问题也随之而来，主要包括信息的过载问题和用户不能准确选择相关信息的问题，而推荐系统是克服信息过载问题的有效工具之一。推荐系统的核心是设计推荐算法，所以在学术界中，提出了各种各样的推荐算法，目前主要使用的推荐算法包括有基于内容的推荐算法、组合推荐算法和协同过滤推荐算法等。为了使用户能够合理的利用并且快速的找到需要的有用信息，首先要做的就是信息的过滤和分类，所以最受欢迎的推荐算法仍然是协同过滤，而且在互联网的各个领域中体现出了实际的应用价值。随着对协同过滤推荐算法的不断深入研究，问题也慢慢暴露出来，比如冷启动问题、数据稀疏性问题、扩展性问题、推荐效率和准确性问题，以及用户兴趣随时间改变的问题等，如何更好地解决这些问题已经成为了当前研究的热点。协同过滤推荐算法是当下应用最广泛的推荐技术，主要是依据用户的历史行为来发现其偏好，针对不同的偏好分别来预测用户可能感兴趣的相似商品。然而，在传统的协同过滤推荐算法中，用户冷启动和数据稀疏性的问题一直都是最主要的问题，这将直接影响推荐的质量和性能，一些学者针对以上存在的问题也提出了改善的方法。王宏杰等人提出一种根据聚类精度来调节特征权重的K-Means聚类算法，以提升聚类的准确性[1]。何明等人提出了基于用户—项目评分矩阵与项目类型来构建用户偏好矩阵，然后用SlopeOne算法进行填充，用来缓减数据稀疏性...

【技术保护点】
1.一种融合时间因素的用户偏好和距离加权的聚类方法，其特征在于该方法主要包括如下关键步骤：第1、基本矩阵：第1.1、对初始数据集进行处理，获得用户—用户属性矩阵和用户—项目评分矩阵；第1.2、构建项目—项目属性矩阵，来表示电影包含的电影属性；第1.3、通过对用户—项目评分矩阵和项目—项目属性矩阵进行计算，得到用户—项目属性总评分矩阵；第2、用户偏好权重的计算：第2.1、对用户—项目评分矩阵进行处理得到用户—项目矩阵，由值0和1来代表一部电影是否包含某个电影属性；第2.2、根据TF‑IDF方法来对上述得到的用户—项目矩阵进行计算，得到用户‑项目属性偏好矩阵；第3、TF‑IDF方法的改进：第3.1、根据遗忘曲线定义一个用户评价电影的时间衰减函数；第3.2、根据用户兴趣的实际变化情况，定义时间窗T，加入到时间衰减函数中产生最终的遗忘函数；第3.3、在TF‑IDF方法的基础上融合最终的遗忘函数，改进用户偏好权重的计算，得到最终的用户—项目属性偏好矩阵；第4、欧氏距离的加权和K‑Means聚类：第4.1、分别对第1.1中的用户—用户属性矩阵，第1.3中的用户—项目属性总评分矩阵和第3.3中的最终...

【技术特征摘要】
1.一种融合时间因素的用户偏好和距离加权的聚类方法，其特征在于该方法主要包括如下关键步骤：第1、基本矩阵：第1.1、对初始数据集进行处理，获得用户—用户属性矩阵和用户—项目评分矩阵；第1.2、构建项目—项目属性矩阵，来表示电影包含的电影属性；第1.3、通过对用户—项目评分矩阵和项目—项目属性矩阵进行计算，得到用户—项目属性总评分矩阵；第2、用户偏好权重的计算：第2.1、对用户—项目评分矩阵进行处理得到用户—项目矩阵，由值0和1来代表一部电影是否包含某个电影属性；第2.2、根据TF-IDF方法来对上述得到的用户—项目矩阵进行计算，得到用户-项目属性偏好矩阵；第3、TF-IDF方法的改进：第3.1、根据遗忘曲线定义一个用户评价电影的时间衰减函数；第3....

【专利技术属性】
技术研发人员：李文杰，薛花，张德干，
申请(专利权)人：天津理工大学，
类型：发明
国别省市：天津,12

全部详细技术资料下载我是这个专利的主人