当前位置: 首页 > 专利查询>福州大学专利>正文

基于递归卷积神经网络和自编码器的动态社区发现方法技术

技术编号:24500224 阅读:19 留言:0更新日期:2020-06-13 04:46
本发明专利技术涉及一种基于递归卷积神经网络和自编码器的动态社区发现方法。该方法:首先,构建基于卷积神经网络的网络空间特征学习模型,学习网络的空间拓扑特征得到网络空间特征向量;其次,融合基于卷积神经网络的网络空间特征学习模型,以网络空间特征向量作为模型的输入,构建基于递归神经网络、卷积神经网络和自编码器的网络时空特征学习模型,学习网络的时空特征得到网络时空特征向量;最后,在网络时空特征向量基础上进行社区发现,以探测出社交网络的动态社区结构。本发明专利技术方法可应用于分析社交网络,自主学习并提取出社交网络时空特征,并且可进一步提升社区结构的模块度,从而揭示真实网络的拓扑结构等,进而有效地预测网络用户行为和信息传播等。

Dynamic community discovery method based on recurrent convolutional neural network and self encoder

【技术实现步骤摘要】
基于递归卷积神经网络和自编码器的动态社区发现方法
本专利技术涉及一种基于递归卷积神经网络和自编码器的动态社区发现方法。
技术介绍
随着互联网,特别是移动互联网的发展,以交友、信息共享等为目的的社交网络平台迅速发展。以新浪微博、微信、淘宝、Twitter和Facebook为代表的国内外社交网络平台上人们可以发表观点、交友互动、传播信息和推销商品等。根据Facebook在2018年第1季度的报告显示,平均每月有22亿的用户使用Facebook,每日的活跃用户量高达14亿并且平均每秒钟就有5个新的账号被创建。此外,国内流行社交软件Wechat的每月活跃用户数也于2018年首次突破了10亿大关。在线社交网络已经成为连接网络信息时空与人类物理世界的桥梁,深刻地改变着人们的行为模式和社会形态。在线社交网络使得人们的面对面的沟通交流不受时间、时空、距离和成本的限制,极大地改变了人们的生活方式,改善了人们生活质量的同时给人们的经济生活乃至国家的安全稳定带来负面的隐患。因此,近年来社交网络上的大数据分析已经成为数据挖掘领域的一个重要研究分支。社区结构是指在一个网络中组成社区的节点间距离比较近或相似度比较高,即一般而言,社区内部节点联系的紧密程度要远高于社区之间节点联系的紧密程度。社区发现在现实世界中的典型应用包括发现人群共同的兴趣或行为模式、从社交网络寻找朋友圈或属于同一组织机构的群体等。社区发现是从中观视角揭示真实网络的拓扑结构和功能、信息在网络上的宏观现象和微观行为,以便能够帮助信息管理者理解网络的动力学及演化机制,进而有效地预测网络用户行为和控制信息在网络的传播。目前,社区发现是社交网络数据挖掘领域一个快速发展的热点研究领域分支。复杂社交网络的节点海量性、结构复杂性和多维演化性等复杂特性使社交网络中的社区发现面临许多挑战。首先,节点海量性对复杂社交网络社区发现算法的性能提出了极为严格的要求,只有具有线性时间复杂度的算法才能够运行在真实的社交网络并切实进行相关的分析应用,目前只有极少数算法满足线性或近线性的时间复杂度要求。其次,结构复杂性同样对复杂社交网络社区发现算法的性能提出了挑战,真实的网络结构是同时包含重叠性、层次性和多重性的,即要求算法能够发现的社区结构要同时具有重叠和层次结构,而且同时能表达节点的多重信息。最后,多维演化性对复杂社交网络社区发现算法的性能提出了更高阶的挑战,真实的网络结构都是随着时间的演变而演变,往往是呈现膨胀增长的趋势,即要求算法发现的社区结构不仅能够探测到社区结构,还能够捕捉和跟踪随着时间维度的变化社区结构的演变规律。实质上,复杂社交网络上的社区发现是一个与时空相关的复杂网络图特征挖掘问题。而深度学习作为能够自主学习数据特征的优秀机器学习方法近年已被学者成功延伸到网络图数据的时空特征学习。
技术实现思路
本专利技术的目的在于提供一种基于递归卷积神经网络和自编码器的动态社区发现方法,该方法可应用于分析社交网络,自主学习并提取出社交网络时空特征,并且可进一步提升社区结构的模块度,从而揭示真实网络的拓扑结构等,进而有效地预测网络用户行为和信息传播等。为实现上述目的,本专利技术的技术方案是:一种基于递归卷积神经网络和自编码器的动态社区发现方法,首先,构建基于卷积神经网络的网络空间特征学习模型,学习网络的空间拓扑特征得到网络空间特征向量;其次,融合基于卷积神经网络的网络空间特征学习模型,以网络空间特征向量作为模型的输入,构建基于递归神经网络、卷积神经网络和自编码器的网络时空特征学习模型,学习网络的时空特征得到网络时空特征向量;最后,在网络时空特征向量基础上进行社区发现,以探测出社交网络的动态社区结构。在本专利技术一实施例中,所述构建基于卷积神经网络的网络空间特征学习模型,学习网络的空间拓扑特征得到网络空间特征向量前,具体实现过程如下:1)数据集预处理:1.1)意见领袖选取:将数据集的网络拓扑结构变换获得网络的邻接矩阵,基于邻接矩阵分析网络拓扑结构,找出群体中最具影响力的意见领袖节点;根据数据集的网络空间结构中节点之间是否存在连接来建构邻接矩阵A,E为网络空间结构中节点之间连接的边的集合;若节点i与节点j之间存在连接ei,j的话,则变量ai,j为1;若节点i与节点j之间不存在连接ei,j的话,变量ai,j为0,邻接矩阵变换方法见公式(1):其中根据邻接矩阵A,建构节点和节点之间的转态概率矩阵C;若节点对其他节点的连接数越多时,则每个连接的转态概率越低;若节点对其他节点的连接数越少时,则每个连接的转态概率越高;也就是若节点i只连接到节点j,并且再无连接到其他节点,则节点j对节点i来说是重要的节点,故转态概率ci,j的值越大,转态概率矩阵C的计算见公式(2):其中在初始阶段,将为每一个节点的影响力分数设置为1,节点影响力分数矩阵定义为S,S矩阵及其初始化见公式(3);再根据转态概率矩阵C计算节点影响力分数矩阵的极限化矩阵,节点影响力分数极限化矩阵为S*,S*的计算见公式(4);最后,再根据节点影响力分数极限化矩阵,找出影响力分数最高的节点i,即意见领袖节点i_leader,其计算见公式(5):S=[s1s2…sn],其中,初始值si=1(3)1.2)邻近节点选取:当找出意见领袖节点后,找出与意见领袖高度邻近的节点,以便根据节点间的非直连邻近性来重构数据集的网络空间结构;当找出的意见节点i,采用欧式距离r(i,j)来计算节点i和节点j之间的非直连接近性,计算公式见(6);计算和比较节点i和其他节点的距离后,取得与节点i距离最短的节点j,即获得与意见领袖节点i_leader最近邻节点j_neighbor,计算公式见(7);其中d(i,j,k)=xi,k-xj,k其中j≠i(7)1.3)矩阵变换:根据找出的与意见领袖节点i_leader最近邻节点j_neighbor,以意见领袖节点i_leader为重构的邻接矩阵的第一列,最近邻节点j_neighbor为第二列;若最近邻节点超过一个时,则重复步骤1)从剩余未变换列位置的节点中选取意见领袖节点,而后重复2)-3)的过程;循环往复,以此重构邻接矩阵X′,X′的计算见公式(8):其中2)构建基于卷积神经网络的网络空间特征学习模型,学习网络的空间拓扑特征得到网络空间特征向量:构建卷积神经网络和自编码器的组合模型,即网络空间特征学习模型,其神经网络包括具有n个神经元的输入层、具有q个神经元的卷积层、具有n个神经元的输出层;而后,将重构邻接矩阵X′分为n个1*n的数据作为网络空间特征学习模型的神经网络的输入,得到网络空间特征向量。在本专利技术一实施例中,所述融合基于卷积神经网络的网络空间特征学习模型,以网络空间特征向量作为模型的输入,构建基于递归神经网络、卷积神经网络和自编码器的网络时空特征学习模型,学习网络的时空特征得到网络时空特征向量的具体过程如下:构建基于递归神经网络、卷积神本文档来自技高网
...

【技术保护点】
1.一种基于递归卷积神经网络和自编码器的动态社区发现方法,其特征在于,首先,构建基于卷积神经网络的网络空间特征学习模型,学习网络的空间拓扑特征得到网络空间特征向量;其次,融合基于卷积神经网络的网络空间特征学习模型,以网络空间特征向量作为模型的输入,构建基于递归神经网络、卷积神经网络和自编码器的网络时空特征学习模型,学习网络的时空特征得到网络时空特征向量;最后,在网络时空特征向量基础上进行社区发现,以探测出社交网络的动态社区结构。/n

【技术特征摘要】
1.一种基于递归卷积神经网络和自编码器的动态社区发现方法,其特征在于,首先,构建基于卷积神经网络的网络空间特征学习模型,学习网络的空间拓扑特征得到网络空间特征向量;其次,融合基于卷积神经网络的网络空间特征学习模型,以网络空间特征向量作为模型的输入,构建基于递归神经网络、卷积神经网络和自编码器的网络时空特征学习模型,学习网络的时空特征得到网络时空特征向量;最后,在网络时空特征向量基础上进行社区发现,以探测出社交网络的动态社区结构。


2.根据权利要求1所述的基于递归卷积神经网络和自编码器的动态社区发现方法,其特征在于,所述构建基于卷积神经网络的网络空间特征学习模型,学习网络的空间拓扑特征得到网络空间特征向量前,具体实现过程如下:
1)数据集预处理:
1.1)意见领袖选取:将数据集的网络拓扑结构变换获得网络的邻接矩阵,基于邻接矩阵分析网络拓扑结构,找出群体中最具影响力的意见领袖节点;
根据数据集的网络空间结构中节点之间是否存在连接来建构邻接矩阵A,E为网络空间结构中节点之间连接的边的集合;若节点i与节点j之间存在连接ei,j的话,则变量ai,j为1;若节点i与节点j之间不存在连接ei,j的话,变量ai,j为0,邻接矩阵变换方法见公式(1):

其中
根据邻接矩阵A,建构节点和节点之间的转态概率矩阵C;若节点对其他节点的连接数越多时,则每个连接的转态概率越低;若节点对其他节点的连接数越少时,则每个连接的转态概率越高;也就是若节点i只连接到节点j,并且再无连接到其他节点,则节点j对节点i来说是重要的节点,故转态概率ci,j的值越大,转态概率矩阵C的计算见公式(2):

其中
在初始阶段,将为每一个节点的影响力分数设置为1,节点影响力分数矩阵定义为S,S矩阵及其初始化见公式(3);再根据转态概率矩阵C计算节点影响力分数矩阵的极限化矩阵,节点影响力分数极限化矩阵为S*,S*的计算见公式(4);最后,再根据节点影响力分数极限化矩阵,找出影响力分数最高的节点i,即意见领袖节点i_leader,其计算见公式(5):
S=[s1s2…sn],其中,初始值si=1(3)






1.2)邻近节点选取:当找出意见领袖节点后,找出与意见领袖高度邻近的节点,以便根据节点间的非直连邻近性来重构数据集的网络空间结构;
当找出的意见节点i,采用欧式距离r...

【专利技术属性】
技术研发人员:吴伶陈志华张岐山
申请(专利权)人:福州大学
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1