当前位置: 首页 > 专利查询>山西大学专利>正文

一种电影社交网络的社区结构检测方法及系统技术方案

技术编号:32215485 阅读:27 留言:0更新日期:2022-02-09 17:21
本发明专利技术公开了一种电影社交网络的社区结构检测方法及系统,所述方法包括:获取用户数据集,根据用户之间的关注关系构建电影社交网络结构,将用户的观影数据作为用户节点属性,基于所述电影社交网络结构和所述用户节点属性建立邻接矩阵和属性矩阵;基于建立的邻接矩阵和属性矩阵,利用图自动编码器构建电影社交网络社区结构检测模型;对于构建的电影社交网络社区结构检测模型,设计一个联合优化目标函数,通过最小化所述联合优化目标函数进行模型训练;利用训练好的电影社交网络社区结构检测模型,实现对电影社交网络的社区结构检测,并将电影社交网络社区结构检测结果进行输出。本发明专利技术能够对电影社交网络中的社区结构进行有效可靠的划分。效可靠的划分。效可靠的划分。

【技术实现步骤摘要】
一种电影社交网络的社区结构检测方法及系统


[0001]本专利技术涉及数据挖掘
,特别涉及一种电影社交网络的社区结构检测方法及系统。

技术介绍

[0002]随着计算机网络技术的快速发展和广泛应用,互联网领域中出现了越来越多的网络社交平台,如Facebook、抖音、微博等,这些社交平台迅猛发展并崛起,逐渐成为人们社交生活中不可或缺的一部分。基于不同社交平台产生了规模庞大且形式多样的社交网络,这种社交网络反映了社会个体之间的互动关系,大大提高了人们建立联系和交流信息的便捷性。电影社交网络作为一种常见的虚拟社交网络,已成为数千万热爱电影的网友使用最多的社交平台。例如,豆瓣是一个社区网站,提供关于书籍、电影、音乐等作品的信息,是Web2.0网站中具有特色的一个网站。豆瓣电影作为豆瓣旗下的一款产品,是中国最大的电影分享与评论社区,汇聚了数千万热爱电影的用户,这些用户之间通过互相关注来建立联系,从而实现信息传递。具有相同或相似兴趣的用户之间往往会存在关联关系,从而聚集在一起形成社区。同一社区的用户联系紧密且互动频繁,有利于信息的传播,便于用户进行兴趣交本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种电影社交网络的社区结构检测方法,其特征在于,包括以下步骤:S10、获取用户数据集,根据用户之间的关注关系构建电影社交网络结构,将用户的观影数据作为用户节点属性,基于所述电影社交网络结构和所述用户节点属性建立邻接矩阵和属性矩阵;所述观影数据包括:电影名称、电影类型、主要演员、地区;S20、基于建立的邻接矩阵和属性矩阵,利用图自动编码器构建电影社交网络社区结构检测模型;S30、对于构建的电影社交网络社区结构检测模型,设计一个联合优化目标函数,通过最小化所述联合优化目标函数进行模型训练;S40、利用训练好的电影社交网络社区结构检测模型,实现对电影社交网络的社区结构检测,并将电影社交网络社区结构检测结果进行输出。2.根据权利要求1所述的电影社交网络的社区结构检测方法,其特征在于,所述步骤S10具体包括以下步骤:S11、从电影社交平台中获取用户数据集,根据用户之间的关注关系构建电影社交网络结构,将社交网络用户表示为网络中的用户节点,将用户之间的关注关系表示为用户节点间的边,将用户的观影数据作为用户节点的属性;将网络记为G=(V,E,X),V={v1,v2,

,v
N
}表示网络中N个用户节点的集合,其中第n个用户记为用户节点v
n
,1≤n≤N;E={e1,e2,

,e
M
}表示用户节点之间存在的M条边,其中第m条边记为e
m
,1≤m≤M;X是N
×
D维的用户节点属性矩阵,其第n行x
n
=[x
n1
,x
n2
,

,x
nD
]表示网络中用户节点v
n
的D个属性,其中元素x
nd
表示用户节点v
n
的第d个属性,1≤d≤D;S12、构建网络G=(V,E,X)的N
×
N维邻接矩阵,将该邻接矩阵记为A,令A中每个元素的值表示网络G=(V,E,X)中两个相应用户节点间的邻接关系,即A中第i行第j列的元素A
ij
代表网络中第i个用户节点v
i
和第j个用户节点v
j
之间的邻接关系,1≤i≤N,1≤j≤N,如果v
i
和v
j
之间存在边,则A
ij
=1,否则A
ij
=0。3.根据权利要求2所述的电影社交网络的社区结构检测方法,其特征在于,所述步骤S20中构建的电影社交网络社区结构检测模型包含编码器、结构解码器、属性解码器、模块度优化器四个部分;所述步骤S20具体包括以下步骤:S21、所述编码器将电影社交网络G=(V,E,X)编码为低维空间中的嵌入向量,使用2层结构相同的图注意力网络作为编码器,将作为输入,其编码过程的形式化表示如下所示:所示:所示:其中,和分别为用户节点v
i
在经过第一层图注意力网络和第二层图注意力网络后得到的低维嵌入向量;s是非线性激活函数;N
i
表示用户节点v
i
的邻居节点;α
ij
称为标准化的注意力系数,由式(4)定义;W
(0)
和W
(1)
分别为第一层图注意力网络和第二层图注意力网络中的连接权重矩阵,是待定参数,在后续步骤中通过输入电影社交网络进行确定;Z为编
码后的嵌入向量构成的集合,z
t
表示由用户节点v
t
编码得到的低维空间中的嵌入向量,且编码得到的低维空间中的嵌入向量,且式中,LeakyReLU()是非线性激活函数,由式(5)定义;a是权重向量;W是权重矩阵;x
i
代表用户节点v
i
的属性;||是连接操作;式中,λ是负输入斜率,取值为0.2;S22、所述结构解码器将嵌入向量集合Z重构为网络关系即结构解码器定义如式(6)所示:其中δ()为狄拉克函数;使用交叉熵函数作为结构重构的损失函数,由式(7)定义:S23、所述属性解码器使用与所述编码器中对称的2层图注意力网络来重构用户节点属性信息,每一层利用其邻居用户节点的表示来重构节点的属性,解码过程可以形式化的表示为:示为:其中,和分别为经过所述属性解码器中第一层图注意力网络和第二层图注意力网络后得到的低维嵌入向量;s是非线性激活函数;N
i
表示用户节点v
i
的邻居节点;称为标准化的注意力系数;和分别为第一层图注意力网络和第二层图注意力网络中的连接权重矩阵;所述属性解码器最后一层的输出作为用户节点v
i
的重构属性即:属性重构的损失函数如式(11)定义:S24、结合所述模块度优化器对社交网络社区结构进行检测;使用softmax函数对节点的低维嵌入向量Z进行分类得到社区分配矩阵P:P=softmax(Z)
ꢀꢀꢀꢀꢀꢀꢀ
(12)
为了使获得的社区内部更紧密,结合模块度对社区结构进行优化;模块度函数被定义为社区内边的数量与所有用户节点对上期望的边数之间的差值,表示为:其中,c
i
表示用户节点v
i
被分配到的社区,如果c
i
=c
j
,则δ(c
i
,c
j
)的值为1,否则为0,是用户节点v
i
和用户节点v
j
之间期望的边数,k
i
是用户节点v
i
的度,是社交网络中边的总数;模块度的矩阵形式可以表示为:其中,P是社区分配矩阵,B是模块度矩阵,B=b
ij
,为了优化式(14),定义了模块度损失:其中,Tr()是矩阵的迹,Tr(P
T
P)=N。4.根据权利要求3所述的电影社交网络的社区结构检测方法,其特征在于,所述步骤S30具体包括以下步骤:S31、将所述编码器、所述结构解码器、所述属性解码器、所述模块度优化器四个部分联合训练,定义一个联合优化目标函数如式(16)所示:L=L
a
+L
x

βL
mod
ꢀꢀꢀꢀꢀꢀꢀ
(16)其中,L
a
是结构重构损失,L
x
是属性重构损失,L
mod
是模块度损失,β是超参数,用来衡量模块度损失的重要性;S32、利用梯度方法进行反向传播,对电影社交网络社区结构检测模型中的连接权重矩阵进行更新。5.根据权利要求1所述的电影社交网络的社区结构检测方法,其特征在于,所述步骤S40具体包括以下步骤:S41、将电影社交网络中兴趣相似的用户划分到同一社区中;用户节点v
i
的社区标签t通过式(17)得到:其中,p
iu
是社区分配矩阵P中的元素,代表用户节点v
i
属于社区u的概率;S42、将电影社交网络社区结构检测结果发送至相关分析人员或科研人员,用于进行包括用户兴趣分析、兴趣社区分析、用户观影行为预测、多样化影片推荐在内的相关任务。6.一种电影社交网络的社区结构检测系统,其特征在于,包括连接计算机处理器和内存的电影社交网络结构构建以及邻接矩阵和属性矩阵构建单元、电影社交网络社区结构检测模型训练单元、电影社交网络社区结构检测结果输出单元;所述电影社交网络结构构建以及邻接...

【专利技术属性】
技术研发人员:杜航原姚倩白亮
申请(专利权)人:山西大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1