一种用户相似度计算方法技术

技术编号：25550874 阅读：25 留言：0更新日期：2020-09-08 18:50

本发明专利技术提供了一种用户相似度计算方法，步骤包括：S1根据用户属性进行聚类分组，计算基于静态属性的相似度sim

全部详细技术资料下载

【技术实现步骤摘要】
一种用户相似度计算方法
本专利技术涉及推荐算法技术，尤其涉及一种用户相似度计算方法
技术介绍
传统的协同过滤推荐算法中，用户相似度计算比较简单，一般直接根据用户历史行为判断相似性，因此准确性不高。为此，现有技术曾经提出了，一种《融合惩罚因子和时间权重的协同过滤推荐算法》，DOI为10.19358/j.issn.2096-5133.2020.05.004。但该传统的协同过滤算法中存在一些问题，如冷启动，数据稀疏和马太效应。兰艳等人利用衰减因子建立非线性时间加权函数，赋予评分不同的时间权重，提高了推荐的准确性。上述文献虽考虑到了用户相似度与时间之间的关系，但是却孤立的计算和登录时间的正相关以及和随时间而衰减的负相关关系，没有将用户相似度与时间的两种关系进行融合考虑。而现有技术《基于用户模糊聚类的综合信任推荐算法》，DOI为10.19678/j.issn.1000-3428.0057930。该传统的协同过滤推荐算法在遇到数据量很大的情况下，推荐时间会增加，准确率也有所降低。此文献中考虑了对用户进行聚类来缩小用户范围。但是它只单一的考虑了聚类对相似度的积极影响，没有考虑影响相似度的其他因子如用户使用频率，操作行为的时间差，位置距离等对相似度的影响。因此目前亟待一种技术来进一步提高相似度计算的准确性。
技术实现思路
本专利技术的主要目的在于提供一种用户相似度计算方法，以较为全面的提高相似度计算的准确性。为了实现上述目的，本专利技术的一个方面，提供了一种用户相似度计算方法，步骤...

【技术保护点】
1.一种用户相似度计算方法，步骤包括：/nS1根据用户属性进行聚类分组，计算基于静态属性的相似度sim

【技术特征摘要】
1.一种用户相似度计算方法，步骤包括：
S1根据用户属性进行聚类分组，计算基于静态属性的相似度simattr；
S2根据用户相似度与登录时间成正比，但又受时间衰减效应计算出相似度simtime；
S3根据用户相似度与用户的操作行为频率呈负相关的关系计算出相似度simfre；
S4通过用户被产品吸引的不确定性，为用户增加自信息量得出相似度siminf；
S5将S1-S4计算得出的各相似度进行叠加和归一化处理，得出最终的用户相似度；其中：

其中表示用户u1对产品y的评分情况；

其中ρ是归一化系数，t1-t2表示登录时间差，σ是时间衰减指数，T1-T2表示操作行为时间差；

其中表示产品y的权值，表示产品y的自信息量；

其中λy表示与频率相关的权值。

2.一种用户相似度计算方法，步骤包括：
S1根据用户属性进行聚类分组，计算基于静态属性的相似度simattr；
S2根据用户相似度与登录时间成正比，但又受时间...

【专利技术属性】
技术研发人员：王斌，张克，
申请(专利权)人：上海大学，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人