一种用户分群方法及计算设备技术

技术编号:17445038 阅读:41 留言:0更新日期:2018-03-10 18:49
本发明专利技术公开了一种用户分群方法,在计算设备中执行,计算设备与数据存储装置连接,数据存储装置中存储有每一个用户对每一个无线网络的连接次数,以及每一个用户对每一个标签的偏好权重。该方法包括:根据每一个用户对每一个无线网络的连接次数来确定两两用户的空间相似度;根据每一个用户对每一个标签的偏好权重来确定两两用户的属性相似度;根据空间相似度和属性相似度来确定两两用户的群组相似度;根据两两用户的群组相似度来确定每一个用户的群组特征向量;根据每一个用户的群组特征向量来对用户进行聚类,以将用户划分为多个群组。本发明专利技术一并公开了相应的计算设备。

【技术实现步骤摘要】
一种用户分群方法及计算设备
本专利技术涉及数据挖掘
,尤其涉及一种用户分群方法及计算设备。
技术介绍
随着移动互联网技术的发展,移动终端已成为人们获取信息的重要媒介,用户对移动终端的操作可以展示出用户的行为偏好。根据用户的行为偏好对用户群体进行划分,对同一个群体中的用户推送相似的信息,或利用相似用户来向目标用户推送信息(协同过滤),可以准确地向用户推送个性化内容。现有的用户分群方法多基于用户的行为特征(例如浏览记录、订单记录、购买历史等)以及兴趣爱好(例如游戏、音乐、阅读等)来对用户进行聚类。这种方法仅考虑到了用户自身的特征,导致其分群结果往往仅适用于特定的应用场景,可移植性较差。此外,由于考虑到的用户特征有限,其分群结果有时不够准确,难以令人满意。
技术实现思路
为此,本专利技术提供一种用户分群方法及计算设备,以解决或至少缓解上面存在的问题。根据本专利技术的一个方面,提供一种用户分群方法,一种用户分群方法,在计算设备中执行,计算设备与数据存储装置连接,数据存储装置中存储有每一个用户对每一个无线网络的连接次数,以及每一个用户对每一个标签的偏好权重,该方法包括:根据每一个用户对每一个无线网络的连接次数来确定两两用户的空间相似度;根据每一个用户对每一个标签的偏好权重来确定两两用户的属性相似度;根据空间相似度和属性相似度来确定两两用户的群组相似度;根据两两用户的群组相似度来确定每一个用户的群组特征向量;根据每一个用户的群组特征向量来对用户进行聚类,以将用户划分为多个群组。可选地,在根据本专利技术的用户分群方法中,根据每一个用户对每一个无线网络的连接次数来确定两两用户的空间相似度的步骤包括:根据每一个用户对每一个无线网络的连接次数来确定邻接矩阵W,邻接矩阵W为N*N的方阵,N为用户与无线网络的数量之和,将每一个用户、每一个无线网络记为一个节点,邻接矩阵W中的元素wij表示节点i与节点j的连接次数;根据邻接矩阵W来确定每一个用户的空间特征向量;根据每一个用户的空间特征向量来确定两两用户的空间相似度。可选地,在根据本专利技术的用户分群方法中,根据邻接矩阵W来确定每一个用户的空间特征向量的步骤包括:根据邻接矩阵W确定拉普拉斯矩阵L=D-W,其中,D为对角矩阵,D中的元素dii=∑jwij;对拉普拉斯矩阵L进行归一化,得到矩阵L'=D-1/2LD-1/2;对矩阵L’进行特征值分解,将特征值按照由小到大的顺序排列,取除了0之外的前k1个特征值所对应的特征向量构成N*k1的第一临时矩阵T1,将第一临时矩阵T1中的用户节点所对应的行向量作为该用户的空间特征向量。可选地,在根据本专利技术的用户分群方法中,根据每一个用户的空间特征向量来确定两两用户的空间相似度的步骤包括:将两个用户的空间特征向量的余弦相似度作为这两个用户的空间相似度。可选地,在根据本专利技术的用户分群方法中,根据每一个用户对每一个标签的偏好权重来确定两两用户的属性相似度的步骤包括:根据每一个用户对每一个标签的偏好权重来确定每一个用户的属性特征向量;根据每一个用户的属性特征向量来确定两两用户的属性相似度。可选地,在根据本专利技术的用户分群方法中,根据每一个用户的属性特征向量来确定两两用户的属性相似度的步骤包括:将两个用户的属性特征向量的余弦相似度作为这两个用户的属性相似度。可选地,在根据本专利技术的用户分群方法中,数据存储装置中还存储有每一个用户在当前时间段内对每一个应用的使用次数,以及应用-标签列表,应用-标签列表中列出了每一个应用所对应的标签;用户对每一个标签的偏好权重按照以下步骤确定:根据用户在当前时间段内对每一个应用的使用次数来确定用户对每一个标签的使用权重;根据用户对每一个标签的使用权重来确定用户对每一个标签的偏好权重。可选地,在根据本专利技术的用户分群方法中,用户对一个标签的使用权重可以按照以下公式确定:fi=α*fi-1+pi其中,fi表示该标签在当前时间段的使用权重,fi-1表示该标签在上一个时间段的使用权重,α为衰减因子,pi为该标签在当前时间段的使用次数,且其中,napp为用户在当前时间段内所使用的应用的数量,timesj表示用户在当前时间段内对应用j的使用次数,βj为布尔因子,当在应用-标签列表中应用j对应于该标签时,βj=1;当在应用-标签列表中应用j不对应于该标签时,βj=0。可选地,在根据本专利技术的用户分群方法中,根据用户对每一个标签的使用权重来确定用户对每一个标签的偏好权重的步骤包括:按照以下公式来确定用户u对标签t的偏好权重wu,t:其中,fu,t为用户u对标签t的使用权重,nlabel为标签的数量,n为用户的数量,nt为标签t的使用权重不为0的用户的数量。可选地,在根据本专利技术的用户分群方法中,根据空间相似度和属性相似度来确定两两用户的群组相似度的步骤包括:将两个用户的空间相似度、属性相似度的加权求和结果作为这两个用户的群组相似度。可选地,在根据本专利技术的用户分群方法中,根据两两用户的群组相似度来确定每一个用户的群组特征向量的步骤包括:根据两两用户的群组相似度来确定群组相似度矩阵S;对群组相似度矩阵S进行特征值分解,将特征值按照由大到小的顺序排列,取前k2个特征值所对应的特征向量构成n*k2的第二临时矩阵T2,将第二临时矩阵T2中的每一个行向量作为该行向量所对应的用户的群组特征向量。根据本专利技术的另一个方面,提供一种计算设备,包括:至少一个处理器;和存储有程序指令的存储器,其中,程序指令被配置为适于由上述至少一个处理器执行,程序指令包括用于执行如上所述的用户分群方法的指令。根据本专利技术的又一个方面,提供一种存储有程序指令的可读存储介质,当所述程序指令被计算设备读取并执行时,使得所述计算设备执行如上所述的用户分群方法。根据本专利技术的技术方案,根据各用户对各无线网络的连接次数来确定两两用户的空间相似度,空间相似度可以表示出两个用户在地理位置、社会关系、兴趣爱好方面的相似度;根据各用户对各标签的偏好权重来确定两两用户的属性相似度,属性相似度可以表示出两个用户在兴趣爱好方面的相似度。根据两两用户的空间相似度和属性相似度来确定两两用户的群组相似度,根据两两用户的群组相似度来确定每一个用户的群组特征向量,对各用户的群组特征向量进行聚类,将用户划分为多个群组。本专利技术的用户分群方法综合考虑了用户自身的特征、用户的地理位置特征以及社会关系特征,结合多维数据来对用户进行分群,使得分群结果更为准确,可适用于多种场景。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。图1示出了根据本专利技术一个实施例的用户分群系统100的示意图;图2示出了根据本专利技术一个实施例的计算设备200的示意图;图3示出了根据本专利技术一个实施例的用户分群方法300的本文档来自技高网...
一种用户分群方法及计算设备

【技术保护点】
一种用户分群方法,在计算设备中执行,所述计算设备与数据存储装置连接,所述数据存储装置中存储有每一个用户对每一个无线网络的连接次数,以及每一个用户对每一个标签的偏好权重,所述方法包括:根据每一个用户对每一个无线网络的连接次数来确定两两用户的空间相似度;根据每一个用户对每一个标签的偏好权重来确定两两用户的属性相似度;根据空间相似度和属性相似度来确定两两用户的群组相似度;根据两两用户的群组相似度来确定每一个用户的群组特征向量;根据每一个用户的群组特征向量来对用户进行聚类,以将用户划分为多个群组。

【技术特征摘要】
1.一种用户分群方法,在计算设备中执行,所述计算设备与数据存储装置连接,所述数据存储装置中存储有每一个用户对每一个无线网络的连接次数,以及每一个用户对每一个标签的偏好权重,所述方法包括:根据每一个用户对每一个无线网络的连接次数来确定两两用户的空间相似度;根据每一个用户对每一个标签的偏好权重来确定两两用户的属性相似度;根据空间相似度和属性相似度来确定两两用户的群组相似度;根据两两用户的群组相似度来确定每一个用户的群组特征向量;根据每一个用户的群组特征向量来对用户进行聚类,以将用户划分为多个群组。2.如权利要求1所述的方法,其中,所述根据每一个用户对每一个无线网络的连接次数来确定两两用户的空间相似度的步骤包括:根据每一个用户对每一个无线网络的连接次数来确定邻接矩阵W,邻接矩阵W为N*N的方阵,N为用户与无线网络的数量之和,将每一个用户、每一个无线网络记为一个节点,邻接矩阵W中的元素wij表示节点i与节点j的连接次数;根据邻接矩阵W来确定每一个用户的空间特征向量;根据每一个用户的空间特征向量来确定两两用户的空间相似度。3.如权利要求2所述的方法,其中,所述根据邻接矩阵W来确定每一个用户的空间特征向量的步骤包括:根据邻接矩阵W确定拉普拉斯矩阵L=D-W,其中,D为对角矩阵,D中的元素dii=∑jwij;对拉普拉斯矩阵L进行归一化,得到矩阵L'=D-1/2LD-1/2;对矩阵L’进行特征值分解,将特征值按照由小到大的顺序排列,取除了0之外的前k1个特征值所对应的特征向量构成N*k1的第一临时矩阵T1,将第一临时矩阵T1中的用户节点所对应的行向量作为该用户的空间特征向量。4.如权利要求2或3所述的方法,其中,所述根据每一个用户的空间特征向量来确定两两用户的空间相似度的步骤包括:将两个用户的空间特征向量的余弦相似度作为这两个用户的空间相似度。5.如权利要求1所述的方法,其中,所述根据每一个用户对每一个标签的偏好...

【专利技术属性】
技术研发人员:路瑶李亮陈日涵
申请(专利权)人:北京腾云天下科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1