一种社会网络关键人物分析方法、终端设备及存储介质技术

技术编号:38762862 阅读:8 留言:0更新日期:2023-09-10 10:36
本发明专利技术涉及一种社会网络关键人物分析方法、终端设备及存储介质,该方法中包括:采集多种模态的多个社会网络关系数据;将不同模态的数据进行模态归一化处理;将每个模态的所有数据进行综合后,输入各模态对应的单模态分析算法,得到每个模态中各节点的单模态特征向量;将不同模态的特征向量进行加权融合得到综合特征向量;计算各节点的PageRank值,基于PageRank值选取前K个节点作为候选关键人物;根据度中心性和介数中心性选取最终的关键人物列表。本发明专利技术可以提高关键人物提取的准确性和全面性。和全面性。和全面性。

【技术实现步骤摘要】
一种社会网络关键人物分析方法、终端设备及存储介质


[0001]本专利技术涉及关键人物分析领域,尤其涉及一种社会网络关键人物分析方法、终端设备及存储介质。

技术介绍

[0002]识别社会网络关系中的关键人物,对于挖掘非法组织头目、网络谣言传播源头发掘等方面有着十分重要的意义。在当前互联网时代,越来越多的用户在社交网络上进行交流和分享,这些交流和分享产生了大量的数据,包括用户之间的关注、转发、评论等行为。因此,社交网络成为了研究人类行为、社会关系和信息传播等方面的重要平台。而关键人物提取技术则成为了从海量社交网络数据中挖掘关键信息的重要工具。
[0003]目前,主流的关键人物提取方法主要包括以下几种:
[0004](1)基于网络结构的方法:这种方法是通过分析社交网络的节点度数、介数、中心性、接近性等指标来确定关键人物。其中,度数中心性指标考虑节点与其他节点连接的数量,介数中心性指标考虑节点在所有最短路径上出现的次数,中心性指标考虑节点在整个网络中的重要程度,接近性指标考虑节点与其他节点的平均距离。常用的算法有PageRank算法、HITS算法、Betweenness centrality算法等。
[0005](2)基于社交网络挖掘的方法:这种方法是通过分析社交网络中节点之间的互动、共现等模式,从而识别其在网络中的作用和影响力。常用的算法有Katz算法、Eigenvector Centrality算法和Community Detection算法等。
[0006](3)基于机器学习的方法:这种方法是利用机器学习算法对社交网络数据进行训练和分类,以识别关键人物。常用的算法有决策树、支持向量机、神经网络等。
[0007]目前,传统的社会网络关键人物提取方法通常只使用单一的数据模态(如文本、图像等),并且来源多为某一社交媒体或者渠道,数据来源不够全面。由于社交网络非常庞大,因此在进行分析时,可能只针对特定的子集进行采样,如仅从某个社交媒体获取社交数据。这种采样偏差可能导致对社交网络结构产生误解,从而忽略了某些重要的关键人物。

技术实现思路

[0008]为了解决上述问题,本专利技术提出了一种社会网络关键人物分析方法、终端设备及存储介质。
[0009]具体方案如下:
[0010]一种社会网络关键人物分析方法,包括以下步骤:
[0011]S1:采集待分析人物目标对应的多种模态的多个社会网络关系数据;
[0012]S2:将不同模态的数据进行模态归一化处理;
[0013]S3:将处理后每个模态的所有数据进行综合后,输入各模态对应的单模态分析算法,得到每个模态中各节点的单模态特征向量;
[0014]S4:将不同模态的特征向量进行加权融合,得到各节点的综合特征向量;
[0015]S5:计算各节点的介数中心性,结合各节点的综合特征向量,计算各节点的PageRank值,将所有节点按照PageRank值从大到小排序,选取前K个节点作为候选关键人物;
[0016]S6:计算各节点的度中心性,根据候选关键人物的度中心性和介数中心性,从候选关键人物中选取最终的关键人物列表。
[0017]进一步的,步骤S3还包括对综合后的数据进行去重和缺失值填充的处理。
[0018]进一步的,各节点的综合特征向量的计算公式如下:
[0019][0020]其中,R
i
表示第i个节点的综合特征向量,m表示模态的总数,j表示模态的序号,w
j
表示第j个模态的权重,S
ij
表示第j个模态对应的第i个节点的单模态特征向量。
[0021]进一步的,模态的权重由该模态包含的节点数量与所有节点总数量的比值决定。
[0022]进一步的,各节点的PageRank值的计算公式为:
[0023][0024]其中,PR(u)和PR(v)分别表示节点u和节点v的PageRank值,d表示阻尼系数,|V|表示节点的总数,B
u
和B
v
分别表示节点u和节点v的邻居节点集合,C
n
(v)和C
n
(w)分别表示节点v和节点w的介数中心性。
[0025]进一步的,步骤S6中根据候选关键人物对应节点的度中心性和介数中心性,从候选关键人物中选取最终的关键人物列表的方法为:针对每个节点,如果其度中心性和介数中心性的数值均大于PageRank值,则设定该节点的节点重要性为PageRank值、度中心性与介数中心性三者的乘积;如果其度中心性和介数中心性的数值均小于或等于PageRank值,则设定该节点的节点重要性为PageRank值/(度中心性*介数中心性);根据各候选关键人物中对应的节点重要性的大小选择关键人物组成关键人物列表。
[0026]进一步的,还包括S7:对关键人物列表中的各关键人物之间的关系进行分析,将分析结果作为关键人物之间的关系标签。
[0027]进一步的,还包括S8:将关键人物列表中的各关键人物和关键人物之间的关系标签在可视化界面进行展示。
[0028]一种社会网络关键人物分析终端设备,包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本专利技术实施例上述的方法的步骤。
[0029]一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现本专利技术实施例上述的方法的步骤。
[0030]本专利技术采用如上技术方案,并具有有益效果:
[0031](1)通过使用多模态数据的融合使得算法可以综合利用更多源的信息,从而提高关键人物提取的准确性和全面性。
[0032](2)采用多种不同算法结合的方式,可以降低对某个特定算法的依赖性,避免单一
算法的局限性。
[0033](3)由于采用了多模态数据的融合,因此在处理大规模数据时,相对于传统的单一模态数据处理方案,能够充分发挥数据的优势,处理效率更高。
[0034](4)可以适用于多种数据类型的关键人物提取,如文本、图像、音频等,具有较强的扩展应用领域。
附图说明
[0035]图1所示为本专利技术实施例一的流程图。
具体实施方式
[0036]为进一步说明各实施例,本专利技术提供有附图。这些附图为本专利技术揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理。配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本专利技术的优点。
[0037]现结合附图和具体实施方式对本专利技术进一步说明。
[0038]实施例一:
[0039]本专利技术实施例提供了一种社会网络关键人物分析方法,如图1所示,其为本专利技术实施例所述的社会网络关键人物分析方法的流程图,所述方法包括以下步骤:
[0040]S1:采集待分析人物目标对应的多种模态的多个社会网络关系数据。
[0041]模态本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种社会网络关键人物分析方法,其特征在于,包括以下步骤:S1:采集待分析人物目标对应的多种模态的多个社会网络关系数据;S2:将不同模态的数据进行模态归一化处理;S3:将处理后每个模态的所有数据进行综合后,输入各模态对应的单模态分析算法,得到每个模态中各节点的单模态特征向量;S4:将不同模态的特征向量进行加权融合,得到各节点的综合特征向量;S5:计算各节点的介数中心性,结合各节点的综合特征向量,计算各节点的PageRank值,将所有节点按照PageRank值从大到小排序,选取前K个节点作为候选关键人物;S6:计算各节点的度中心性,根据候选关键人物的度中心性和介数中心性,从候选关键人物中选取最终的关键人物列表。2.根据权利要求1所述的社会网络关键人物分析方法,其特征在于:步骤S3还包括对综合后的数据进行去重和缺失值填充的处理。3.根据权利要求1所述的社会网络关键人物分析方法,其特征在于:各节点的综合特征向量的计算公式如下:其中,R
i
表示第i个节点的综合特征向量,m表示模态的总数,j表示模态的序号,w
j
表示第j个模态的权重,S
ij
表示第j个模态对应的第i个节点的单模态特征向量。4.根据权利要求3所述的社会网络关键人物分析方法,其特征在于:模态的权重由该模态包含的节点数量与所有节点总数量的比值决定。5.根据权利要求1所述的社会网络关键人物分析方法,其特征在于:各节点的PageRank值的计算公式为:其中,PR()和PR()分别表示节点u和节点v的PageRank值,d表示阻尼系数,||表示节点的总数,B

【专利技术属性】
技术研发人员:李孟豪刘艺坚江文涛张翔
申请(专利权)人:罗普特厦门系统集成有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1