当前位置: 首页 > 专利查询>山西大学专利>正文

一种微博网络的用户社群结构划分方法及系统技术方案

技术编号:28223422 阅读:22 留言:0更新日期:2021-04-28 09:52
本发明专利技术公开了一种微博网络的用户社群结构划分方法及系统,所述方法包括:采集微博网络用户数据,并进行数据检验与预处理,得到可用的微博网络用户数据;获得的可用的微博网络用户数据,利用若干典型聚类方法进行处理,生成微博网络的一系列独立的初始用户社群结构划分结果;利用WCT方法对生成的初始用户社群结构划分结果进行处理,得到微博网络用户数据全局结构信息描述;构建图神经网络聚类集成框架,对获得的微博网络用户数据全局结构信息描述进行集成,得到微博网络的用户社群结构划分结果;输出微博网络的用户社群结构划分结果。本发明专利技术能够提高微博网络用户社群结构划分的鲁棒性、准确性和稳定性。准确性和稳定性。准确性和稳定性。

【技术实现步骤摘要】
一种微博网络的用户社群结构划分方法及系统


[0001]本专利技术涉及Web数据挖掘
,特别涉及一种微博网络的用户社群结构划分方法及系统。

技术介绍

[0002]近年来,微博作为一种广播式网络平台,为用户提供了广阔的分享和交流空间。随着微博网络用户的日益增加,微博运营商如何为用户提供更精准的服务是目前需要解决的一个问题。微博网络用户在平台上产生的海量数据中蕴含着丰富的用户行为信息,通过对微博网络用户数据的分析研究,可以获得更多微博网络用户数据中包含的商业价值和现实意义,从而为微博运营商的精准营销、个性化服务推荐、商品推荐等任务提供支持。
[0003]当前微博网络用户社群结构划分任务常使用聚类方法进行实现,然而目前使用的聚类方法比较单一,单一的聚类方法一方面对于微博网络用户社群结构划分的可靠性和稳定性存在不足;另一方面,微博网络用户数据存在拓扑结构,而这些聚类方法并没有充分挖掘微博网络用户之间存在的关系,导致微博网络用户社群结构的划分结果并不理想。

技术实现思路

[0004]本专利技术的目的在于提供一种微博网络的用户社群结构划分方法及系统,通过聚类集成方法,利用图神经网络聚类集成框架,对微博网络的用户社群结构进行划分,从而为微博运营商更好地优化个性化服务、提升营销收益提供支持。
[0005]为解决上述技术问题,本专利技术的实施例提供如下方案:
[0006]一方面,提供了一种微博网络的用户社群结构划分方法,包括以下步骤:
[0007]S10、采集微博网络用户数据,并进行数据检验与预处理,得到可用的微博网络用户数据;
[0008]S20、对获得的可用的微博网络用户数据,利用若干典型聚类方法进行处理,生成微博网络的一系列独立的初始用户社群结构划分结果;
[0009]S30、利用WCT方法对生成的初始用户社群结构划分结果进行处理,得到微博网络用户数据全局结构信息描述;
[0010]S40、构建图神经网络聚类集成框架,对获得的微博网络用户数据全局结构信息描述进行集成,得到微博网络的用户社群结构划分结果;
[0011]S50、输出微博网络的用户社群结构划分结果。
[0012]优选地,所述步骤S10具体包括以下步骤:
[0013]S11、利用网络爬虫工具抓取微博网络用户数据,并对微博网络用户数据进行预处理:剔除无效微博网络用户数据,将微博网络用户名、性别、地区、注册时间、账号名称、微博认证进行编码转换,存储为连续唯一的数值型数据;
[0014]S12、利用包含微博网络用户名、性别、地区、注册时间、账号名称、微博认证在内的属性信息将每个微博网络用户表示为向量形式,其中每个属性表现为向量的一个分量,全
体微博网络用户构成的向量集合记作X={x1,

,x
M
},其中M表示微博网络用户的数量,x
m
用于表示第m个(1≤m≤M)微博网络用户的向量。
[0015]优选地,所述步骤S20具体包括以下步骤:
[0016]S21、利用若干典型聚类方法对可用的微博网络用户数据进行处理,获得微博网络的一系列初始用户社群结构划分结果,集合C={C1,

,C
N
},表示微博网络初始用户社群结构划分结果中的所有微博网络用户社群结构,N表示微博网络用户社群结构的数量,C
n
表示第n个(1≤n≤N)微博网络用户社群结构。
[0017]优选地,所述步骤S30具体包括以下步骤:
[0018]S31、使用以下公式计算微博网络初始用户社群结构划分结果中,所有具有相交关系的微博网络用户社群结构之间的相似度,其中具有相交关系的微博网络用户社群结构是指包含公共微博网络用户的微博网络用户社群结构:
[0019][0020]其中,C
i
表示微博网络初始用户社群结构划分结果中的第i个微博网络用户社群结构,C
j
表示微博网络初始用户社群结构划分结果中的第j个微博网络用户社群结构,w
ij
表示微博网络用户社群结构C
i
和微博网络用户社群结构C
j
之间的相似度,C
i
∩C
j
表示微博网络用户社群结构C
i
和微博网络用户社群结构C
j
的相交部分,C
i
∪C
j
表示微博网络用户社群结构C
i
和微博网络用户社群结构C
j
中的所有微博网络用户;
[0021]S32、利用WCT方法计算微博网络初始用户社群结构划分结果中,所有不相交的微博网络用户社群结构之间的相似度;
[0022]其中,如果微博网络用户社群结构C
l
分别与微博网络用户社群结构C
a
和微博网络用户社群结构C
b
相交,但微博网络用户社群结构C
a
与微博网络用户社群结构C
b
不相交,则微博网络用户社群结构C
a
,微博网络用户社群结构C
b
,微博网络用户社群结构C
l
组成一个三元组,且微博网络用户社群结构C
a
,微博网络用户社群结构C
b
,微博网络用户社群结构C
l
组成的三元组不唯一;
[0023]利用微博网络用户社群结构C
a
,微博网络用户社群结构C
b
之间存在的任意一个三元组计算微博网络用户社群结构C
a
,微博网络用户社群结构C
b
之间的相似度,方法如下所示:
[0024][0025]其中,表示利用微博网络用户社群结构C
a
,微博网络用户社群结构C
b
之间存在的一个三元组计算得到的微博网络用户社群结构C
a
,微博网络用户社群结构C
b
之间的相似度,w
al
为由步骤S31中公式计算得到的微博网络用户社群结构C
a
和微博网络用户社群结构C
l
之间的相似度,w
bl
为由步骤S31中公式计算得到的微博网络用户社群结构C
b
和微博网络用户社群结构C
l
之间的相似度;
[0026]根据微博网络用户社群结构C
a
,微博网络用户社群结构C
b
之间存在的所有三元组对微博网络用户社群结构C
a
,微博网络用户社群结构C
b
之间的相似度进行计算,方法如下所示:
[0027][0028]其中,WCT
ab
为利用微博网络用户社群结构C
a
和微博网络用户社群结构C
b
之间存在的所有三元组计算得到的微博网络用本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种微博网络的用户社群结构划分方法,其特征在于,包括以下步骤:S10、采集微博网络用户数据,并进行数据检验与预处理,得到可用的微博网络用户数据;S20、对获得的可用的微博网络用户数据,利用若干典型聚类方法进行处理,生成微博网络的一系列独立的初始用户社群结构划分结果;S30、利用WCT方法对生成的初始用户社群结构划分结果进行处理,得到微博网络用户数据全局结构信息描述;S40、构建图神经网络聚类集成框架,对获得的微博网络用户数据全局结构信息描述进行集成,得到微博网络的用户社群结构划分结果;S50、输出微博网络的用户社群结构划分结果。2.根据权利要求1所述的微博网络的用户社群结构划分方法,其特征在于,所述步骤S10具体包括以下步骤:S11、利用网络爬虫工具抓取微博网络用户数据,并对微博网络用户数据进行预处理:剔除无效微博网络用户数据,将微博网络用户名、性别、地区、注册时间、账号名称、微博认证进行编码转换,存储为连续唯一的数值型数据;S12、利用包含微博网络用户名、性别、地区、注册时间、账号名称、微博认证在内的属性信息将每个微博网络用户表示为向量形式,其中每个属性表现为向量的一个分量,全体微博网络用户构成的向量集合记作X={x1,

,x
M
},其中M表示微博网络用户的数量,x
m
用于表示第m个(1≤m≤M)微博网络用户的向量。3.根据权利要求1所述的微博网络的用户社群结构划分方法,其特征在于,所述步骤S20具体包括以下步骤:S21、利用若干典型聚类方法对可用的微博网络用户数据进行处理,获得微博网络的一系列初始用户社群结构划分结果,集合C={C1,

,C
N
},表示微博网络初始用户社群结构划分结果中的所有微博网络用户社群结构,N表示微博网络用户社群结构的数量,C
n
表示第n个(1≤n≤N)微博网络用户社群结构。4.根据权利要求1所述的微博网络的用户社群结构划分方法,其特征在于,所述步骤S30具体包括以下步骤:S31、使用以下公式计算微博网络初始用户社群结构划分结果中,所有具有相交关系的微博网络用户社群结构之间的相似度,其中具有相交关系的微博网络用户社群结构是指包含公共微博网络用户的微博网络用户社群结构:其中,C
i
表示微博网络初始用户社群结构划分结果中的第i个微博网络用户社群结构,C
j
表示微博网络初始用户社群结构划分结果中的第j个微博网络用户社群结构,w
ij
表示微博网络用户社群结构C
i
和微博网络用户社群结构C
j
之间的相似度,C
i
∩C
j
表示微博网络用户社群结构C
i
和微博网络用户社群结构C
j
的相交部分,C
i
∪C
j
表示微博网络用户社群结构C
i
和微博网络用户社群结构C
j
中的所有微博网络用户;S32、利用WCT方法计算微博网络初始用户社群结构划分结果中,所有不相交的微博网
络用户社群结构之间的相似度;其中,如果微博网络用户社群结构C
l
分别与微博网络用户社群结构C
a
和微博网络用户社群结构C
b
相交,但微博网络用户社群结构C
a
与微博网络用户社群结构C
b
不相交,则微博网络用户社群结构C
a
,微博网络用户社群结构C
b
,微博网络用户社群结构C
l
组成一个三元组,且微博网络用户社群结构C
a
,微博网络用户社群结构C
b
,微博网络用户社群结构C
l
组成的三元组不唯一;利用微博网络用户社群结构C
a
,微博网络用户社群结构C
b
之间存在的任意一个三元组计算微博网络用户社群结构C
a
,微博网络用户社群结构C
b
之间的相似度,方法如下所示:其中,表示利用微博网络用户社群结构C
a
,微博网络用户社群结构C
b
之间存在的一个三元组计算得到的微博网络用户社群结构C
a
,微博网络用户社群结构C
b
之间的相似度,w
al
为由步骤S31中公式计算得到的微博网络用户社群结构C
a
和微博网络用户社群结构C
l
之间的相似度,w
bl
为由步骤S31中公式计算得到的微博网络用户社群结构C
b
和微博网络用户社群结构C
l
之间的相似度;根据微博网络用户社群结构C
a
,微博网络用户社群结构C
b
之间存在的所有三元组对微博网络用户社群结构C
a
,微博网络用户社群结构C
b
之间的相似度进行计算,方法如下所示:其中,WCT
ab
为利用微博网络用户社群结构C
a
和微博网络用户社群结构C
b
之间存在的所有三元组计算得到的微博网络用户社群结构C
a
和微博网络用户社群结构C
b
之间的相似度,g为微博网络用户社群结构C
a
,微博网络用户社群结构C
b
之间存在的所有三元组的数量,根据以下公式计算微博网络用户社群结构C
a
和微博网...

【专利技术属性】
技术研发人员:杜航原张晶王文剑白亮
申请(专利权)人:山西大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1