数据分析方法、数据分析装置、设备及存储介质制造方法及图纸

技术编号:35025656 阅读:17 留言:0更新日期:2022-09-24 22:57
本申请实施例提供了一种数据分析方法、数据分析装置、设备及存储介质,属于数据分析技术领域。该方法包括:获取社交网络平台的原始数据,所述原始数据包括原始用户信息和原始项目信息;对所述原始数据进行过滤处理,以得到目标数据;其中,所述目标数据包括:目标用户信息和目标项目信息;根据所述目标用户信息和所述目标项目信息进行超图网络构建,得到超图社交网络;对所述超图社交网络进行属性分析,以得到分析结果。本申请实施例通过目标用户信息和目标项目信息进行超图网络构建,并对超图社交网络进行不同属性的分析,以探究社交网络平台的用户与用户之间、用户与项目之间的协作程度,能够提高分析结果的准确率。能够提高分析结果的准确率。能够提高分析结果的准确率。

【技术实现步骤摘要】
数据分析方法、数据分析装置、设备及存储介质


[0001]本专利技术涉及数据分析
,尤其涉及一种数据分析方法、数据分析装置、设备及存储介质。

技术介绍

[0002]目前有许多研究对社交网络平台的社交网络进行了探索研究。例如,抽取某一年或近10年Github平台上所有的用户信息和项目信息,包括用户与用户之间的关注关系、复刻关系、赞关系等,以及各项目的合作者关系等。在这些关系的基础上,分别构建了用户图网络和/或项目图网络,并对图网络的属性进行分析。例如,通过用户信息和项目信息分析用户的影响力、活跃程度和用户之间的协作程度。但是,上述的分析方式难以体现社交网络平台的复杂关系,分析结果的准确率较低。因此,如何提供一种数据分析方法,能够提高对社交网络平台的分析准确率,成为了亟待解决的技术问题。

技术实现思路

[0003]本公开实施例的主要目的在于提出一种数据分析方法、数据分析装置、设备及存储介质,能够提高对社交网络平台的分析准确率。
[0004]为实现上述目的,本公开实施例的第一方面提出了一种数据分析方法,所述方法包括:
[0005]获取社交网络平台的原始数据,所述原始数据包括原始用户信息和原始项目信息;
[0006]对所述原始数据进行过滤处理,以得到目标数据;其中,所述目标数据包括:目标用户信息和目标项目信息;
[0007]根据所述目标用户信息和所述目标项目信息进行超图网络构建,得到超图社交网络;
[0008]对所述超图社交网络进行属性分析,以得到分析结果。
>[0009]在一些实施例,所述超图社交网络包括顶点集、超边集、以及超边权重值集,所述根据所述目标用户信息和目标项目信息进行超图网络构建,得到超图社交网络,包括:
[0010]根据所述目标用户信息和所述目标项目信息创建顶点集,所述顶点集包括多个对象顶点;
[0011]根据所述目标用户信息的用户连接关系、所述目标用户信息和所述目标项目信息之间的用户项目连接关系确定对象超边;其中,每一所述对象超边包括多个所述对象顶点;
[0012]根据所述用户连接关系和所述用户项目连接关系的关系类型确定所述对象超边的对象权重值;
[0013]根据所述对象超边得到超边集,并根据所述对象权重值得到超边权重值集。
[0014]在一些实施例,所述分析结果包括以下至少一种:活跃度分析结果、互联程度分析结果、顶点重要度分析结果,对应的,所述对所述超图社交网络进行属性分析,以得到分析
结果,包括以下步骤至少之一:
[0015]对所述超图社交网络进行点度中心性分析,得到所述活跃度分析结果;
[0016]对所述超图社交网络进行路径和距离分析,得到所述互联程度分析结果;
[0017]对所述超图社交网络进行接近中心性分析或中介中心性分析,得到顶点重要度分析结果。
[0018]在一些实施例,所述对所述超图社交网络进行点度中心性分析,得到所述活跃度分析结果,包括:
[0019]根据所述对象顶点和所述对象超边的所属关系确定关联矩阵;
[0020]根据所述关联矩阵计算每个所述对象顶点关联的对象超边的关联数量;
[0021]根据所述关联数量得到所述活跃度分析结果。
[0022]在一些实施例,所述对所述超图社交网络进行路径和距离分析,得到所述互联程度分析结果,包括:
[0023]计算每两个所述对象顶点的最短路径,得到多个最短路径长度;
[0024]计算每两个所述对象顶点的最长路径,得到多个最长路径长度;
[0025]根据多个所述最短路径长度计算平均最短路径长度;
[0026]根据多个所述最长路径长度计算平均最长路径长度;
[0027]根据所述平均最短路径长度和所述平均最长路径长度得到所述互联程度分析结果。
[0028]在一些实施例,所述对所述超图社交网络进行接近中心性分析或中介中心性分析,得到顶点重要度分析结果,包括:
[0029]若对所述超图社交网络进行接近中心性分析,对于每个所述对象顶点,计算所述对象顶点与目标对象顶点的最短路径,得到多个最短路径长度;
[0030]根据多个所述最短路径长度的总和得到所述顶点重要度分析结果。
[0031]在一些实施例,所述对所述超图社交网络进行接近中心性分析或中介中心性分析,得到顶点重要度分析结果,包括:
[0032]若对所述超图社交网络进行中介中心性分析,遍历所有的所述对象顶点,确定每两个所述对象顶点的最短路径,所述最短路径包括至少一个中间对象顶点,根据所述中间对象顶点的数量得到所述顶点重要度分析结果。
[0033]本公开实施例的第二方面提出了一种数据分析装置,所述装置包括:
[0034]获取模块,用于获取社交网络平台的原始数据,所述原始数据包括原始用户信息和原始项目信息;
[0035]过滤模块,用于对所述原始数据进行过滤处理,以得到目标数据;其中,所述目标数据包括:目标用户信息和目标项目信息;
[0036]超图社交网络创建模块,用于根据所述目标用户信息和所述目标项目信息进行超图网络构建,得到超图社交网络;
[0037]属性分析模块,用于对所述超图社交网络进行属性分析,以得到分析结果。
[0038]为实现上述目的,本申请实施例的第三方面提出了一种计算机设备,所述计算机设备包括存储器、处理器、存储在所述存储器上并可在所述处理器上运行的程序以及用于实现所述处理器和所述存储器之间的连接通信的数据总线,所述程序被所述处理器执行时
实现上述第一方面所述的方法的步骤。
[0039]为实现上述目的,本申请实施例的第四方面提出了一种存储介质,所述存储介质为计算机可读存储介质,用于计算机可读存储,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述第一方面所述的方法的步骤。
[0040]本公开实施例提出的数据分析方法、数据分析装置、设备及存储介质,通过根据目标用户信息和目标项目信息进行超图网络构建,并对超图社交网络进行不同属性的分析,以探究社交网络平台的用户与用户之间和用户与项目之间的协作程度,能够提高分析结果的准确率。
附图说明
[0041]图1是本申请实施例提供的数据分析方法的流程图;
[0042]图2是图1中的步骤S103的流程图;
[0043]图3是本申请实施例提供的数据分析方法的另一流程图;
[0044]图4是本申请实施例提供的数据分析方法的另一流程图;
[0045]图5是本申请实施例提供的数据分析装置的模块结构框图;
[0046]图6是本申请实施例提供的计算机设备的硬件结构示意图。
具体实施方式
[0047]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
[004本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据分析方法,其特征在于,所述方法包括:获取社交网络平台的原始数据,所述原始数据包括原始用户信息和原始项目信息;对所述原始数据进行过滤处理,以得到目标数据;其中,所述目标数据包括:目标用户信息和目标项目信息;根据所述目标用户信息和所述目标项目信息进行超图网络构建,得到超图社交网络;对所述超图社交网络进行属性分析,以得到分析结果。2.根据权利要求1所述的方法,其特征在于,所述超图社交网络包括顶点集、超边集、以及超边权重值集,所述根据所述目标用户信息和目标项目信息进行超图网络构建,得到超图社交网络,包括:根据所述目标用户信息和所述目标项目信息创建顶点集,所述顶点集包括多个对象顶点;根据所述目标用户信息的用户连接关系、所述目标用户信息和所述目标项目信息之间的用户项目连接关系确定对象超边;其中,每一所述对象超边包括多个所述对象顶点;根据所述用户连接关系和所述用户项目连接关系的关系类型确定所述对象超边的对象权重值;根据所述对象超边得到超边集,并根据所述对象权重值得到超边权重值集。3.根据权利要求2所述的方法,其特征在于,所述分析结果包括以下至少一种:活跃度分析结果、互联程度分析结果、顶点重要度分析结果,对应的,所述对所述超图社交网络进行属性分析,以得到分析结果,包括以下步骤至少之一:对所述超图社交网络进行点度中心性分析,得到所述活跃度分析结果;对所述超图社交网络进行路径和距离分析,得到所述互联程度分析结果;对所述超图社交网络进行接近中心性分析或中介中心性分析,得到顶点重要度分析结果。4.根据权利要求3所述的方法,其特征在于,所述对所述超图社交网络进行点度中心性分析,得到所述活跃度分析结果,包括:根据所述对象顶点和所述对象超边的所属关系确定关联矩阵;根据所述关联矩阵计算每个所述对象顶点关联的对象超边的关联数量;根据所述关联数量得到所述活跃度分析结果。5.根据权利要求3所述的方法,其特征在于,所述对所述超图社交网络进行路径和距离分析,得到所述互联程度分析结果,包括:计算每两个所述对象顶点的最短路径,得到多个最短路径长度;计...

【专利技术属性】
技术研发人员:胡秋月秦培武
申请(专利权)人:清华伯克利深圳学院筹备办公室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1