一种融合时间因素的用户偏好和距离加权的聚类方法技术

技术编号:20160454 阅读:51 留言:0更新日期:2019-01-19 00:13
一种融合时间因素的用户偏好和距离加权的聚类方法,通过引入由用户基本客观特征构造的用户—用户属性矩阵来缓解用户冷启动问题,而稀疏性问题的改进主要是通过引入项目特征,由于项目的特征可以从内容的方面来体现用户偏好,从而能够达到减少矩阵的维数;将项目特征引入到用户—项目评分来得到小维数的用户—项目属性总评分矩阵;用TF‑IDF算法构建用户—项目属性偏好矩阵时引入项目特征,同时考虑用户兴趣随时间漂移对用户偏好的影响;基于以上的三个矩阵来得到加权后欧氏距离,然后利用K‑Means算法进行聚类。本方法是以电影的推荐为例,在MovieLens数据集上进行的实验结果表明,与其他相关的算法相比,该方法具有较好的推荐质量和性能。

【技术实现步骤摘要】
一种融合时间因素的用户偏好和距离加权的聚类方法
本专利技术涉及个性化推荐算法,具体提供一种融合了时间因素的用户偏好和距离加权的聚类方法。
技术介绍
近年来,随着信息技术和Web2.0的发展,互联网的信息出现了前所未有的暴涨,问题也随之而来,主要包括信息的过载问题和用户不能准确选择相关信息的问题,而推荐系统是克服信息过载问题的有效工具之一。推荐系统的核心是设计推荐算法,所以在学术界中,提出了各种各样的推荐算法,目前主要使用的推荐算法包括有基于内容的推荐算法、组合推荐算法和协同过滤推荐算法等。为了使用户能够合理的利用并且快速的找到需要的有用信息,首先要做的就是信息的过滤和分类,所以最受欢迎的推荐算法仍然是协同过滤,而且在互联网的各个领域中体现出了实际的应用价值。随着对协同过滤推荐算法的不断深入研究,问题也慢慢暴露出来,比如冷启动问题、数据稀疏性问题、扩展性问题、推荐效率和准确性问题,以及用户兴趣随时间改变的问题等,如何更好地解决这些问题已经成为了当前研究的热点。协同过滤推荐算法是当下应用最广泛的推荐技术,主要是依据用户的历史行为来发现其偏好,针对不同的偏好分别来预测用户可能感兴趣的相似商本文档来自技高网...

【技术保护点】
1.一种融合时间因素的用户偏好和距离加权的聚类方法,其特征在于该方法主要包括如下关键步骤:第1、基本矩阵:第1.1、对初始数据集进行处理,获得用户—用户属性矩阵和用户—项目评分矩阵;第1.2、构建项目—项目属性矩阵,来表示电影包含的电影属性;第1.3、通过对用户—项目评分矩阵和项目—项目属性矩阵进行计算,得到用户—项目属性总评分矩阵;第2、用户偏好权重的计算:第2.1、对用户—项目评分矩阵进行处理得到用户—项目矩阵,由值0和1来代表一部电影是否包含某个电影属性;第2.2、根据TF‑IDF方法来对上述得到的用户—项目矩阵进行计算,得到用户‑项目属性偏好矩阵;第3、TF‑IDF方法的改进:第3.1...

【技术特征摘要】
1.一种融合时间因素的用户偏好和距离加权的聚类方法,其特征在于该方法主要包括如下关键步骤:第1、基本矩阵:第1.1、对初始数据集进行处理,获得用户—用户属性矩阵和用户—项目评分矩阵;第1.2、构建项目—项目属性矩阵,来表示电影包含的电影属性;第1.3、通过对用户—项目评分矩阵和项目—项目属性矩阵进行计算,得到用户—项目属性总评分矩阵;第2、用户偏好权重的计算:第2.1、对用户—项目评分矩阵进行处理得到用户—项目矩阵,由值0和1来代表一部电影是否包含某个电影属性;第2.2、根据TF-IDF方法来对上述得到的用户—项目矩阵进行计算,得到用户-项目属性偏好矩阵;第3、TF-IDF方法的改进:第3.1、根据遗忘曲线定义一个用户评价电影的时间衰减函数;第3....

【专利技术属性】
技术研发人员:李文杰薛花张德干
申请(专利权)人:天津理工大学
类型:发明
国别省市:天津,12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1