数据关联性分析方法及系统、可读存储介质技术方案

技术编号：23765097 阅读：23 留言：0更新日期：2020-04-11 19:24

本发明专利技术提供的数据关联性分析方法及系统、可读存储介质，根据待分析数据对象的字段点的特性选择对应的相关系数计算模型，计算在同一时间段内不同的字段点两两之间的相关系数，以得到两两强显性相关的字段点及待分析数据对象，构建社会网络关系矩阵，绘制出不同业务之间的强相关业务的社会网络结构图，计算及排名出选到的各业务各字段点在所述社会网络结构中的中心度和中心势；根据中心度对社会网络结构中的业务进行重要度排名；根据中心势确定社会网络结构中各业务的总体整合度。本发明专利技术提供的以上方案，将社会网络分析引入业务管理信息系统的众多数据资源的分析中，推动信息资源的精简及整合，明了不同平台或系统间业务数据的联动性。

Data association analysis method and system, readable storage medium

全部详细技术资料下载

【技术实现步骤摘要】
数据关联性分析方法及系统、可读存储介质
本专利技术涉及数据统计及分析应用
，具体涉及一种数据关联性分析方法及系统和一种可读存储介质。
技术介绍
政务资源信息系统及共享平台包含的业务子系统众多，其涉及到的业务字段更多，且不同的业务字段分散在各自不同子系统的不同数据表中。难以确定不同平台或不同系统中的数据之间是否有关联，而且分辨及快速掌握哪些数据是关键业务数据也较为困难。操作人员不能确定各业务系统数据在整体系统中的重要程度如何，为各业务系统信息整合、相互间信息交换与共享及信息资源合理布局等工作的有效进行增添了障碍或降低了效率。
技术实现思路
本专利技术实施例旨在提供一种数据分析方法和系统、一种可读存储介质，以解决现有技术中难以对多系统中的多种数据进行关联性判断，整合数据难度大和效率低的技术问题。本专利技术提供一种数据关联性分析方法，包括如下步骤：获取待分析数据对象，所述待分析数据对象来自于不同的业务且对应于同一时间段，每一所述待分析数据对象具有特定的字段点；根据所述待分析数据对象的字段点的特性选择对应的相关系数计算模型，根据所述相关系数计算模型计算在所述时间段内不同的所述字段点两两之间的相关系数得到相关性计算结果；根据所述相关性计算结果得到两两强显性相关的字段点，确定两两强显性相关的待分析数据对象，依据两两强显性相关的待分析数据对象构建社会网络关系矩阵，所述社会网络关系矩阵中各向量间的关系值为对应的相关系数绝对值；根据所述社会网络关系矩阵绘制出不同业务之间...

【技术保护点】
1.一种数据关联性分析方法，其特征在于，包括如下步骤：/n获取待分析数据对象，所述待分析数据对象来自于不同的业务且对应于同一时间段，每一所述待分析数据对象具有特定的字段点；/n根据所述待分析数据对象的字段点的特性选择对应的相关系数计算模型，根据所述相关系数计算模型计算在所述时间段内不同的所述字段点两两之间的相关系数得到相关性计算结果；/n根据所述相关性计算结果得到两两强显性相关的字段点，确定两两强显性相关的待分析数据对象，依据两两强显性相关的待分析数据对象构建社会网络关系矩阵，所述社会网络关系矩阵中各向量间的关系值为对应的相关系数绝对值；/n根据所述社会网络关系矩阵绘制出不同业务之间的强相关业务的社会网络结构图，计算及排名出选到的各业务各字段点在所述社会网络结构中的中心度和中心势；/n根据所述中心度对所述社会网络结构中的业务进行重要度排名；根据所述中心势确定所述社会网络结构中各业务的总体整合度。/n

【技术特征摘要】
1.一种数据关联性分析方法，其特征在于，包括如下步骤：
获取待分析数据对象，所述待分析数据对象来自于不同的业务且对应于同一时间段，每一所述待分析数据对象具有特定的字段点；
根据所述待分析数据对象的字段点的特性选择对应的相关系数计算模型，根据所述相关系数计算模型计算在所述时间段内不同的所述字段点两两之间的相关系数得到相关性计算结果；
根据所述相关性计算结果得到两两强显性相关的字段点，确定两两强显性相关的待分析数据对象，依据两两强显性相关的待分析数据对象构建社会网络关系矩阵，所述社会网络关系矩阵中各向量间的关系值为对应的相关系数绝对值；
根据所述社会网络关系矩阵绘制出不同业务之间的强相关业务的社会网络结构图，计算及排名出选到的各业务各字段点在所述社会网络结构中的中心度和中心势；
根据所述中心度对所述社会网络结构中的业务进行重要度排名；根据所述中心势确定所述社会网络结构中各业务的总体整合度。

2.根据权利要求1所述的数据关联性分析方法，其特征在于，根据所述待分析数据对象的字段点的特性选择对应的相关系数计算模型，根据所述相关系数计算模型计算在所述时间段内不同的所述字段点两两之间的相关系数得到相关性计算结果，在此步骤中，所述待分析数据对象的字段点的特性字段变量是连续型数据时选择对应的Pearson相关系数计算模型，所述Pearson相关系数计算模型为：

其中，σX和σY分别表示X，Y两个变量的标准差；Cov(X，Y)表示X，Y两个变量的协方差，且X，Y两个变量的标准差均不等于零。

3.根据权利要求1所述的数据关联性分析方法，其特征在于，根据所述待分析数据对象的字段点的特性选择对应的相关系数计算模型，根据所述相关系数计算模型计算在所述时间段内不同的所述字段点两两之间的相关系数得到相关性计算结果，在此步骤中，所述待分析数据对象的字段点的特性字段变量是分类有序型数据时选择对应的Spearman相关系数计算模型，所述Spearman相关系数计算模型为：

其中，m为等级个数；d为二列成对变量的等级差数。

4.根据权利要求1所述的数据关联性分析方法，其特征在于，根据所述待分析数据对象的字段点的特性选择对应的相关系数计算模型，根据所述相关系数计算模型计算在所述时间段内不同的所述字段点两两之间的相关系数得到相关性计算结果，在此...

【专利技术属性】
技术研发人员：侯占杰，周轶，季学伟，方理平，李燕，张艳艳，陈明，陈晓岚，刘耀峰，梅楠，张维，侯烺祎，贾娜莉，刘艳，
申请(专利权)人：北京市安全生产科学技术研究院，北京天之华软件系统技术有限责任公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人