一种社区发现方法、装置、存储介质及终端设备制造方法及图纸

技术编号:21302194 阅读:26 留言:0更新日期:2019-06-12 08:37
本发明专利技术实施例公开了一种社区发现方法、装置、存储介质及终端设备。所述社区发现方法包括:基于预设规则确定待分析网络中预设数量的目标网络节点,并基于所述目标网络节点构建约束点集合;根据所述约束点集合构建约束矩阵;根据所述约束矩阵对所述待分析网络进行社区结构划分。通过本发明专利技术实施例提供的技术方案,能够充分利用待分析网络中的约束信息,但又不会过分依赖先验知识,准确、高效地对待分析网络进行社区结构的划分,有利于进一步指导待分析网络的社区结构的挖掘。

A Community Discovery Method, Device, Storage Media and Terminal Equipment

The embodiment of the present invention discloses a community discovery method, device, storage medium and terminal device. The community discovery method includes: determining the preset number of target network nodes in the network to be analyzed based on preset rules, constructing a set of constraints based on the target network nodes, constructing a constraints matrix based on the set of constraints, and dividing the community structure of the network to be analyzed according to the constraints matrix. The technical scheme provided by the embodiment of the present invention can make full use of the constraint information in the network to be analyzed without excessive reliance on prior knowledge, treat the analysis network accurately and efficiently to divide the community structure, and is conducive to further guiding the mining of the community structure of the network to be analyzed.

【技术实现步骤摘要】
一种社区发现方法、装置、存储介质及终端设备
本专利技术实施例涉及复杂网络
,尤其涉及社区发现方法、装置、存储介质及终端设备。
技术介绍
现实世界中,许多复杂系统都可以被描述成复杂网络的形式。复杂网络一般是指节点数量庞大,连接关系复杂的网络,网络中的节点由各个实体抽象而成,实体与实体之间的关系构成了网络中的边,例如,社会网络、Internet网络、城市交通网络及科研项目合作网络等等。社区结构作为复杂网络的重要特征之一,在人们的生活正扮演着重要的角色。及时、准确的发现网络中所隐藏的社区结构,进而分析复杂系统的内部特征,不仅可以指导人们的生产活动,而且对于理解并控制复杂系统也有很大帮助。以科研合作项目网络为例,阐述一下对复杂网络中社区结构进行挖掘的重要性。随着现代科学的不断发展,跨区域、跨机构和跨学科的科研合作已成为科学研究的主流趋势,在科学研究过程中日益重要。科研项目合作可以使科研人员之间相互取长补短,充分利用现有的科研条件,共享各种科研资源,出色完成高水平的科研任务。据研究统计,诺贝尔奖获得者的科研成果中有70%是与别人合作研究而取得的。通过分析科研项目中的论文合著关系,可以构建科研项目合著网络,对该网络进行社区结构挖掘,可以获取个人、机构以及地区之间的科研合作与学术交流水平,同时也能反映出特定领域的研究热度和科研合作质量;通过分析科研项目中的项目合作关系,可以构建项目合作网络,对该网络进行社区结构挖掘,可以获取科研网络中科研人员合作的紧密程度与合作模式以及各个学科发展趋势,并且通过对潜在科研团队进行挖掘,可以为整个科研团队的发展提供指导性意见。基于此,对科研项目网络的社区结构挖掘,能帮助科研人员了解所在学科的研究热点及趋势;有助于政府和有关决策部门制定宏观科研政策、优化科研资源配置及培植优秀科研团队;有助于政府和国家了解各个学科的发展趋势,推动创新型国家的发展与建设。同样的,对于其他复杂网络进行社区结构的挖掘,同样至关重要。相关技术中,社区发现算法大致分为两类:无监督学习和半监督学习。然而,现有的基于无监督社区发现算法中,仅依赖网络中的拓扑结构,忽视了网络中的拓扑信息,而这些拓扑信息对社区发现具有很大的影响,因此,无监督的社区发现方法具有一定的盲目性。基于此,半监督聚类变成数据挖掘与网络分析中研究的热点问题。半监督聚类首先对少量先验知识进行学习,进而实现对聚类过程的指导,从而提高聚类的精度和性能。然而,现有的基于半监督社区发现方法中,存在如下不足:(1)仅适用于小规模的复杂网络;(2)没有充分利用约束对链接信息,或者过分依赖先验信息;(3)无法发现网络中重叠社区结构,降低了网络的可解释性。因此,提供一种高效、准确的社区发现方法,变得至关重要。
技术实现思路
本专利技术实施例提供一种社区发现方法、装置、存储介质及终端设备,可以有效提高复杂网络中社区发现的准确率和效率。第一方面,本专利技术实施例提供了一种社区发现方法,包括:基于预设规则确定待分析网络中预设数量的目标网络节点,并基于所述目标网络节点构建约束点集合;根据所述约束点集合构建约束矩阵;根据所述约束矩阵对所述待分析网络进行社区结构划分。进一步的,基于预设规则确定待分析网络中预设数量的目标网络节点,包括:获取待分析网络对应的网络邻接矩阵;其中,所述网络邻接矩阵表示所述待分析网络的网络拓扑结构;根据网络邻接矩阵及预先获取的随机初始化矩阵构建第一目标函数;通过最小化所述第一目标函数生成所述随机初始化矩阵的第一更新规则,并根据所述第一更新规则对所述随机初始化矩阵进行更新直至所述随机初始化矩阵收敛;根据收敛后的随机初始化矩阵确定所述待分析网络中预设数量的目标网络节点。进一步的,根据收敛后的随机初始化矩阵确定所述待分析网络中预设数量的目标网络节点,包括:计算收敛后的随机初始化矩阵中每行元素之和,并对每行元素之和按照递减的顺序排序;将各个元素之和中预设数量的最大的元素之和对应的随机初始化矩阵中的网络节点,确定为所述待分析网络中的目标网络节点。进一步的,根据网络邻接矩阵及预先获取的随机初始化矩阵构建第一目标函数,包括:根据如下公式构建第一目标函数:其中,L(B)表示第一目标函数,A表示网络邻接矩阵,B表示随机初始化矩阵,β表示预先设定的正则化系数,||A-AB||F表示对矩阵A-AB求F范数。进一步的,所述第一更新规则如下:其中,D为对角矩阵,进一步的,获取待分析网络对应的网络邻接矩阵,包括:读取待分析网络对应的数据集文件;根据所述数据集文件构建所述待分析网络对应的网络邻接矩阵。进一步的,根据所述约束点集合构建约束矩阵,包括:对所述约束点集合中的目标网络节点进行must-link约束对约束,将所述约束点集合划分为至少两个约束点子集合;其中,所述约束点子集合中包括至少两个约束到相同社区的目标网络节点;根据所述约束点子集合及所述待分析网络中的非约束节点构建目标约束点集合;其中,所述非约束节点包括所述待分析网络中除所述目标网络节点外的网络节点;根据所述目标约束点集合构建约束矩阵。进一步的,根据所述约束点子集合及所述待分析网络中的非约束节点构建目标约束点集合,包括:根据如下公式构建目标约束点集合:相应的,所述约束矩阵如下:C=(Cij)∈R(q+n-p)*n;其中,Mi表示第i个目标约束点集合,Pi表示第i个约束点子集合,C表示约束矩阵,Cij表示约束矩阵C中第i行第j列的元素,q表示约束点子集合的个数,n表示所述待分析网络中网络节点的个数,p表示所述约束点集合中包含的目标网络节点的个数;当待分析网络中网络节点j属于所述第i个目标约束点集合时,Cij=1,否则,Cij=0。进一步的,根据所述约束矩阵对所述待分析网络进行社区结构划分,包括:根据所述约束矩阵及预先设定的辅助矩阵构建第二目标函数;通过最小化所述第二目标函数生成所述辅助矩阵的第二更新规则,并根据所述第二更新规则对所述辅助矩阵进行更新直至所述辅助矩阵收敛;计算收敛后的辅助矩阵与所述约束矩阵的乘积,得到所述待分析网络中社区结构的划分结果。进一步的,根据所述约束矩阵及预先设定的辅助矩阵构建第二目标函数,包括:根据如下公式构建第二目标函数:其中,C表示约束矩阵,Z表示辅助矩阵,A表示所述待分析网络对应的网络邻接矩阵,||A-CTZTZC||F表示对矩阵A-CTZTZC求F范数。进一步的,所述第二更新规则如下:进一步的,所述待分析网络包括科研项目合作网络。第二面,本专利技术实施例还提供了一种社区发现装置,包括:约束点集合构建模块,用于基于预设规则确定待分析网络中预设数量的目标网络节点,并基于所述目标网络节点构建约束点集合;约束矩阵构建模块,用于根据所述约束点集合构建约束矩阵;社区结构划分模块,用于根据所述约束矩阵对所述待分析网络进行社区结构划分。第三方面,本专利技术实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本专利技术实施例第一方面所述的社区发现方法。第四方面,本专利技术实施例提供了一种终端设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本专利技术实施例第一方面所述社区发现方法。本专利技术实施例提供的社区发现方案本文档来自技高网
...

【技术保护点】
1.一种社区发现方法,其特征在于,包括:基于预设规则确定待分析网络中预设数量的目标网络节点,并基于所述目标网络节点构建约束点集合;根据所述约束点集合构建约束矩阵;根据所述约束矩阵对所述待分析网络进行社区结构划分。

【技术特征摘要】
1.一种社区发现方法,其特征在于,包括:基于预设规则确定待分析网络中预设数量的目标网络节点,并基于所述目标网络节点构建约束点集合;根据所述约束点集合构建约束矩阵;根据所述约束矩阵对所述待分析网络进行社区结构划分。2.根据权利要求1所述的方法,其特征在于,基于预设规则确定待分析网络中预设数量的目标网络节点,包括:获取待分析网络对应的网络邻接矩阵;其中,所述网络邻接矩阵表示所述待分析网络的网络拓扑结构;根据网络邻接矩阵及预先获取的随机初始化矩阵构建第一目标函数;通过最小化所述第一目标函数生成所述随机初始化矩阵的第一更新规则,并根据所述第一更新规则对所述随机初始化矩阵进行更新直至所述随机初始化矩阵收敛;根据收敛后的随机初始化矩阵确定所述待分析网络中预设数量的目标网络节点。3.根据权利要求2所述的方法,其特征在于,根据收敛后的随机初始化矩阵确定所述待分析网络中预设数量的目标网络节点,包括:计算收敛后的随机初始化矩阵中每行元素之和,并对每行元素之和按照递减的顺序排序;将各个元素之和中预设数量的最大的元素之和对应的随机初始化矩阵中的网络节点,确定为所述待分析网络中的目标网络节点。4.根据权利要求2所述的方法,其特征在于,根据网络邻接矩阵及预先获取的随机初始化矩阵构建第一目标函数,包括:根据如下公式构建第一目标函数:其中,L(B)表示第一目标函数,A表示网络邻接矩阵,B表示随机初始化矩阵,β表示预先设定的正则化系数,||A-AB||F表示对矩阵A-AB求F范数。5.根据权利要求4所述的方法,其特征在于,所述第一更新规则如下:其中,D为对角矩阵,6.根据权利要求2所述的方法,其特征在于,获取待分析网络对应的网络邻接矩阵,包括:读取待分析网络对应的数据集文件;根据所述数据集文件构建所述待分析网络对应的网络邻接矩阵。7.根据权利要求1所述的方法,其特征在于,根据所述约束点集合构建约束矩阵,包括:对所述约束点集合中的目标网络节点进行must-link约束对约束,将所述约束点集合划分为至少两个约束点子集合;其中,所述约束点子集合中包括至少两个约束到相同社区的目标网络节点;根据所述约束点子集合及所述待分析网络中的非约束节点构建目标约束点集合;其中,所述非约束节点包括所述待分析网络中除所述目标网络节点外的网络节点;根据所述目标约束点集合构建约束...

【专利技术属性】
技术研发人员:顾军华武君艳许馨匀谢志坚陈博佘士耀张亚娟张素琪
申请(专利权)人:河北工业大学
类型:发明
国别省市:天津,12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1