System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及大数据领域,尤其涉及一种数据应用复杂度判断方法、装置设备及存储介质。
技术介绍
1、数据应用复杂度是指应用实体例如数据表、数据库等之间引用关系的紧密程度,实体关系越紧密,代表复杂度越高。随着企业数字化进程推进,大数据的应用越来越多,使得数据应用间的引用关系愈加复杂。
2、现有技术中对于评估数据应用复杂度主要依靠人工经验进行判断,使得对于数据应用复杂度的判断结果受到个人主观性的影响,进而容易产生判断误差。
技术实现思路
1、有鉴于此,本申请提供了一种数据应用复杂度判断方法及装置,旨在解决现有技术中在评估数据应用复杂度时主要依靠人工经验进行判断,使得对于数据应用复杂度的判断结果受到个人主观性的影响,进而容易产生判断误差的问题。
2、第一方面,本申请提供了一种数据应用复杂度判断方法,包括:
3、获取目标任务的运行信息和所述目标任务的数据血缘关系;
4、根据所述数据血缘关系生成关系图谱,所述关系图谱为带有方向的非闭环图谱;
5、根据所述关系图谱中节点之间的关系,计算复杂度值,所述复杂度值越大,所述目标任务的数据应用复杂度越高。
6、可选的,所述获取目标任务的运行信息和所述目标任务的数据血缘关系包括:
7、当所述目标任务运行的数据平台中存储有所述目标任务的数据血缘关系时,在所述目标任务运行的数据平台中获取所述目标任务的运行信息和所述目标任务的数据血缘关系。
8、可选的,所述获取目标任务的
9、当所述目标任务运行的数据平台中没有所述目标任务的数据血缘关系时,在所述目标任务运行的数据平台中获取所述目标任务的运行信息,根据所述运行信息确定所述目标任务的数据血缘关系。
10、可选的,所述根据所述数据血缘关系生成关系图谱包括:
11、从所述数据血缘关系中获取与所述目标任务具有血缘关系的数据库和数据表;
12、以所述数据库和所述数据表为实体节点,以各实体节点和所述目标任务之间的血缘关系为关系边生成关系图谱。
13、可选的,所述根据所述关系图谱中节点之间的关系,计算复杂度值包括:
14、对所述关系图谱中的实体节点进行分组,对于分组后的节点进行第一复杂度值和第二复杂度值计算;
15、所述第一复杂度值计算包括,对所述关系图谱中属于同一组的组内各节点分别进行关联度计算,然后将所述属于同一组的组内各节点的复杂度值进行聚合,得到所述第一复杂度值;
16、所述第二复杂度值计算包括,同时对所述关系图谱中属于同一组的所有节点之间的关联度进行计算,得到所述第二复杂度值;
17、对所述第一复杂度值和所述第二复杂度值进行标准化处理;
18、分别对标准化处理后的第一复杂度值和标准化处理后的第二复杂度值设置权重,计算加权平均值,得到复杂度值。
19、第二方面,本申请提供了一种数据应用复杂度判断装置,包括:
20、获取单元,用于获取目标任务的运行信息和所述目标任务的数据血缘关系;
21、关系图谱生成单元,用于根据所述数据血缘关系生成关系图谱,所述关系图谱为带有方向的非闭环图谱;
22、计算单元,用于根据所述关系图谱中节点之间的关系,计算复杂度值,所述复杂度值越大,所述目标任务的数据应用复杂度越高。
23、可选的,所述获取单元具体用于:
24、当所述目标任务运行的数据平台中存储有所述目标任务的数据血缘关系时,在所述目标任务运行的数据平台中获取所述目标任务的运行信息和所述目标任务的数据血缘关系。
25、可选的,所述获取单元具体用于,当所述目标任务运行的数据平台中没有所述目标任务的数据血缘关系时,在所述目标任务运行的数据平台中获取所述目标任务的运行信息,根据所述运行信息确定所述目标任务的数据血缘关系。
26、可选的,所述关系图谱生成单元具体用于,从所述数据血缘关系中获取与所述目标任务具有血缘关系的数据库和数据表;
27、以所述数据库和所述数据表为实体节点,以各实体节点和所述目标任务之间的血缘关系为关系边生成关系图谱。
28、可选的,所述计算单元具体用于,对所述关系图谱中的实体节点进行分组,对于分组后的节点进行第一复杂度值和第二复杂度值计算;
29、所述第一复杂度值计算包括,对所述关系图谱中属于同一组的组内各节点分别进行关联度计算,然后将所述属于同一组的组内各节点的复杂度值进行聚合,得到所述第一复杂度值;
30、所述第二复杂度值计算包括,同时对所述关系图谱中属于同一组的所有节点之间的关联度进行计算,得到所述第二复杂度值;
31、对所述第一复杂度值和所述第二复杂度值进行标准化处理;
32、分别对标准化处理后的第一复杂度值和标准化处理后的第二复杂度值设置权重,计算加权平均值,得到复杂度值。
33、第三方面,本申请提供了一种设备,所述设备包括存储器和处理器,所述存储器用于存储指令或代码,所述处理器用于执行所述指令或代码,以使所述设备执行前述第一方面任一项所述的数据应用复杂度判断方法。
34、第四方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有代码,当所述代码被运行时,运行所述代码的设备实现前述第一方面任一项所述的数据应用复杂度判断方法。
35、本申请提供了一种数据应用复杂度判断方法。在执行所述方法时,先获取目标任务的运行信息和所述目标任务的数据血缘关系,然后根据所述数据血缘关系生成关系图谱,所述关系图谱为带有方向的非闭环图谱,再根据所述关系图谱中节点之间的关系,计算复杂度值,所述复杂度值越大,所述目标任务的数据应用复杂度越高。如此,通过获取目标任务的运行信息和血缘关系,然后根据目标任务的运行信息和数据血缘关系生成关系图谱,通过关系图谱计算出复杂度值,进一步得到目标任务中的数据的应用复杂度,解决了现有技术中对于评估数据应用复杂度主要依靠人工经验进行判断,使得对于数据应用复杂度的判断结果受到个人主观性的影响,进而容易产生判断误差的缺点。
本文档来自技高网...【技术保护点】
1.一种数据应用复杂度判断方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述获取目标任务的运行信息和所述目标任务的数据血缘关系包括:
3.根据权利要求1所述的方法,其特征在于,所述获取目标任务的运行信息和所述目标任务的数据血缘关系包括:
4.根据权利要求1所述的方法,其特征在于,所述根据所述数据血缘关系生成关系图谱包括:
5.根据权利要求1所述的方法,其特征在于,所述根据所述关系图谱中节点之间的关系,计算复杂度值包括:
6.一种数据应用复杂度判断装置,其特征在于,所述装置包括:
7.根据权利要求6所述的装置,其特征在于,所述获取单元具体用于:
8.根据权利要求6所述的装置,其特征在于,所述获取单元具体用于:
9.一种计算设备,其特征在于,所述设备包括:存储器、处理器;
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的数据应用复杂度判断方法。
【技术特征摘要】
1.一种数据应用复杂度判断方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述获取目标任务的运行信息和所述目标任务的数据血缘关系包括:
3.根据权利要求1所述的方法,其特征在于,所述获取目标任务的运行信息和所述目标任务的数据血缘关系包括:
4.根据权利要求1所述的方法,其特征在于,所述根据所述数据血缘关系生成关系图谱包括:
5.根据权利要求1所述的方法,其特征在于,所述根据所述关系图谱中节点之间的关系,计算复杂度...
【专利技术属性】
技术研发人员:冯亮,王磊,孙谷飞,陈志远,
申请(专利权)人:太保科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。