用户相似度的计算方法、计算系统、设备及存储介质技术方案

技术编号:32165016 阅读:12 留言:0更新日期:2022-02-08 15:19
本公开提供一种用户相似度的计算方法、系统、计算机设备及计算机可读存储介质,所述方法包括获取用户

【技术实现步骤摘要】
用户相似度的计算方法、计算系统、设备及存储介质


[0001]本公开属于电子商务
,具体涉及一种用户相似度的计算方法,一种用户相似度的计算系统,一种计算机设备,以及一种计算机可读存储介质。

技术介绍

[0002]一个好的推荐系统能够促进消费者进行消费行为,提高用户购物体验以及提升留存度,最终达到提高卖家交易额的目的。在推荐系统中协同过滤(Collaborative Filtering,简称CF)算法是其代表算法,被各大电商平台广泛应用。协同过滤算法主要有基于用户的协同过滤(User

CF)算法和基于商品的协同过滤(Item

CF)算法。如图1所示,User

CF算法的关键是找到目标用户的相似用户,综合相似用户的偏好商品推荐给目标用户。步骤分为三步:1、获取用户

商品评分信息;2、根据用户

商品评分信息计算用户相似度并按照大小排序,取其中相似度较大的前N个用户,作为近邻用户集;3、根据近邻用户集对商品的评分,对用户未知的商品进行评分预测,将预测评分较高的商品推荐给用户。
[0003]可以看出,用户相似度计算是User

CF算法的关键。用户相似度计算基于用户

商品评分矩阵完成,求解时可以使用到的策略有余弦相似度、修正的余弦相似度、皮尔逊(Pearson)相关系数、杰卡德(Jaccard)相似度等。
[0004]由于现有用户相似度计算是基于用户

商品评分矩阵完成的,需要数据集中,并且有足够的用户行为信息,当用户历史行为较少时,就会出现用户间没有足够的共同商品评分信息,即用户

商品评分矩阵数据稀疏的问题,而对于为非共同评分商品的评分,现有用户相似度计算无法进行利用,导致用户间的相似性计算不准确,从而难以做出准确率较高的推荐;导致推荐系统的推荐可靠度和推荐精度不高。

技术实现思路

[0005]本公开提供一种用户相似度的计算方法、计算系统、计算机设备及存储介质,使得用户间共同评分信息较少的情况下也能计算用户相似度,缓解了数据稀疏和冷启动的局限性,使商品推荐更加精准。
[0006]第一方面,本公开提供一种用户相似度的计算方法,包括:
[0007]获取用户

商品评分矩阵;
[0008]根据所述用户

商品评分矩阵,采用预设的全局相似度计算方法计算其中任意两个用户的全局相似度,以及采用预设的局部相似度计算方法计算其中任意两个用户的局部相似度;
[0009]根据所述用户

商品评分矩阵中任意两个用户的全局相似度和局部相似度计算所述任意两个用户的整体相似度。
[0010]进一步的,所述采用预设的全局相似度计算方法计算其中任意两个用户的全局相似度,采用如下公式得出:
[0011][0012]式(1)中,sim
global
(u,v)为所述用户

商品评分矩阵中用户u与用户v的全局相似度,R
ui
表示用户u对商品i的评分,R
vj
表示用户v对商品j的评分,分别表示用户u、用户v对所有已评分商品的评分平均值,I
u
、I
v
分别表示用户u、用户v评分的商品,I
uv
表示用户u、用户v共同评分的商品,i、j取正整数。
[0013]进一步的,所述任意两个用户的局部相似度基于修正的巴氏系数计算得出,其中修正的巴氏系数采用如下的计算公式计算:
[0014][0015]式(2)中:BC

(u,v)为所述用户

商品评分矩阵中用户u与用户v的修正的巴氏系数,表示用户数,表示用户表示用户u已评分的商品总量,表示用户v已评分的商品总量,表示用户u或用户v评分为k的商品总量,m表示用户对商品评分的类别总数。
[0016]进一步的,当所述用户

商品评分矩阵中的任意两个用户之间没有共同评分的商品时,所述任意两个用户的局部相似度采用如下计算公式得出:
[0017]sim
local
(u,v)=BC

(u,v)
ꢀꢀꢀ
(3)
[0018]式(3)中:sim
local
(u,v)为所述用户

商品评分矩阵中用户u与用户v的局部相似度,BC

(u,v)所述用户

商品评分矩阵中用户u与用户v的修正的巴氏系数。
[0019]进一步的,当所述用户

商品评分矩阵中的任意两个用户之间有共同评分的商品时,所述任意两个用户的局部相似度采用如下计算公式得出:
[0020][0021]式(4)中:sim
local
(u,v)为所述用户

商品评分矩阵中用户u与用户v的局部相似度,BC

(u,v)为所述用户

商品评分矩阵中用户u与用户v的修正的巴氏系数,R
ui
表示用户u对商品i的评分,R
vj
表示用户v对商品j的评分,分别表示用户u、用户v对所有已评分商品的评分平均值,I
u
、I
v
分别表示用户u、用户v评分的商品,I
uv
表示用户u、用户v共同评分的商品,i、j取正整数。
[0022]进一步的,所述根据所述用户

商品评分矩阵中任意两个用户的全局相似度和局部相似度计算所述任意两个用户的整体相似度,采用如下公式得出:
[0023]sim(u,v)=sim
global
(u,v)+sim
local
(u,v)
ꢀꢀꢀ
(5)
[0024]式(5)中:sim(u,v)为所述用户

商品评分矩阵中用户u与用户v的整体相似度,sim
global
(u,v)为用户u与用户v的全局相似度,sim
local
(u,v)为用户u与用户v的局部相似度。
[0025]第二方面,本公开提供一种用户相似度的计算系统,包括:
[0026]获取模块,其设置为获取用户

商品评分矩阵;
[0027]第一计算模块,其设置为根据所述用户

商品评分矩阵,采用预设的全局相似度计
算方法计算其中任意两个用户的全局相似度;
[0028]第二计算模块,其设置为根据所述用户

商品评分矩阵,采用预设的局部相似度计算方法计算其中任意两个用户的局部相似度;
[0029]第三计算模块,其设置为根据所述用户

商品评分矩阵中任意两个用户的全局相似度和局本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户相似度的计算方法,其特征在于,包括:获取用户

商品评分矩阵;根据所述用户

商品评分矩阵,采用预设的全局相似度计算方法计算其中任意两个用户的全局相似度,以及采用预设的局部相似度计算方法计算其中任意两个用户的局部相似度;根据所述用户

商品评分矩阵中任意两个用户的全局相似度和局部相似度计算所述任意两个用户的整体相似度。2.根据权利要求1所述的计算方法,其特征在于,所述采用预设的全局相似度计算方法计算其中任意两个用户的全局相似度,采用如下公式得出:式(1)中,sim
global
(u,v)为所述用户

商品评分矩阵中用户u与用户v的全局相似度,R
ui
表示用户u对商品i的评分,R
vj
表示用户v对商品j的评分,分别表示用户u、用户v对所有已评分商品的评分平均值,I
u
、I
v
分别表示用户u、用户v评分的商品,I
uv
表示用户u、用户v共同评分的商品,i、j取正整数。3.根据权利要求1所述的计算方法,其特征在于,所述任意两个用户的局部相似度基于修正的巴氏系数计算得出,其中修正的巴氏系数采用如下的计算公式计算:式(2)中:BC

(u,v)为所述用户

商品评分矩阵中用户u与用户v的修正的巴氏系数,表示用户示用户表示用户u已评分的商品总量,表示用户v已评分的商品总量,表示用户u或用户v评分为k的商品总量,m表示用户对商品评分的类别总数。4.根据权利要求3所述的计算方法,其特征在于,当所述用户

商品评分矩阵中的任意两个用户之间没有共同评分的商品时,所述任意两个用户的局部相似度采用如下计算公式得出:sim
local
(u,v)=BC

(u,v)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)式(3)中:sim
local
(u,v)为所述用户

商品评分矩阵中用户u与用户v的局部相似度,BC

(u,v)所述用户

商品评分矩阵中用户u与用户v的修正的巴氏系数。5.根据权利要求3所述的计算方法,其特征在于,当所述用户

商品评分矩阵中的任意两个用户之间有共同评分的商品时,所述任意两个用户的局部相似度采用如下计算公式得出:式(4)中:sim
local
(u,v)为所述用户

商品评分矩阵中用户u与用户v的局部相似度,BC

(u,v)为所述用户

商品评分矩阵中用户u与用户v的修正的巴氏系数,R
ui
...

【专利技术属性】
技术研发人员:霍慧
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1