数据关联性分析方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:37912672 阅读:9 留言:0更新日期:2023-06-21 22:35
本申请公开了一种数据关联性分析方法、装置、电子设备及可读存储介质,属于数据处理技术领域。本申请实施例的数据关联性分析方法包括:获取待分析样本数据,确定待分析样本数据的预测特征和待分析样本数据的多个分析特征,并计算预测特征与每个分析特征的目标相关系数,该预测特征为无序离散特征,该目标相关系数表征预测特征与每个分析特征的相关性,并根据预测特征与每个分析特征的目标相关系数,对多个分析特征进行处理。由此,可以更好的处理无序离散特征与其它特征的相关性,从而提升数据分析结果的准确性。据分析结果的准确性。据分析结果的准确性。

【技术实现步骤摘要】
数据关联性分析方法、装置、电子设备及可读存储介质


[0001]本申请属于数据处理
,具体涉及一种数据关联性分析方法、装置、电子设备及可读存储介质。

技术介绍

[0002]目前,样本数据的关联性分析(或称为探索),通常使用皮尔逊相关系数计算样本数据的两两特征之间的交互性,并利用散点图来进行可视化描述。但是,皮尔逊相关系数更适用于连续特征和有序离散特征,对于无序离散特征,由于其编码的不唯一性,会导致计算的皮尔逊相关系数也不唯一,从而造成数据分析结果的准确性较差。

技术实现思路

[0003]本申请实施例的目的是提供一种数据关联性分析方法、装置、电子设备及可读存储介质,以解决目前数据分析方法的准确性较差的问题。
[0004]为了解决上述技术问题,本申请是这样实现的:
[0005]第一方面,提供了一种数据关联性分析方法,包括:
[0006]获取待分析样本数据;
[0007]确定所述待分析样本数据的预测特征和所述待分析样本数据的多个分析特征;
[0008]计算所述预测特征与每个所述分析特征的目标相关系数;其中,所述预测特征为无序离散特征,所述目标相关系数表征所述预测特征与每个所述分析特征的相关性;
[0009]根据所述预测特征与每个所述分析特征的目标相关系数,对所述多个分析特征进行处理。
[0010]第二方面,提供了一种数据关联性分析装置,包括:
[0011]获取模块,用于获取待分析样本数据;
[0012]确定模块,用于确定所述待分析样本数据的预测特征和所述待分析样本数据的多个分析特征;
[0013]计算模块,用于计算所述预测特征与每个所述分析特征的目标相关系数;其中,所述预测特征为无序离散特征,所述目标相关系数表征所述预测特征与每个所述分析特征的相关性;
[0014]处理模块,用于根据所述预测特征与每个所述分析特征的目标相关系数,对所述多个分析特征进行处理。
[0015]第三方面,提供了一种电子设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
[0016]第四方面,提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
[0017]本申请实施例中,在获取待分析样本数据之后,可以确定待分析样本数据的预测
特征和待分析样本数据的多个分析特征,并计算预测特征与每个分析特征的目标相关系数,该预测特征为无序离散特征,该目标相关系数表征预测特征与每个分析特征的相关性,并根据预测特征与每个分析特征的目标相关系数,对多个分析特征进行处理。由此,可以更好的处理无序离散特征与其它特征的相关性,从而提升数据分析结果的准确性。
附图说明
[0018]图1是本申请实施例提供的一种数据关联性分析方法的流程图;
[0019]图2是本申请实施例中确定单个特征信息过程的流程图;
[0020]图3是本申请实施例中散点图的示意图;
[0021]图4是本申请实施例中六边形图的示意图;
[0022]图5是本申请实施例中的数据关联性分析过程的流程图;
[0023]图6是本申请实施例提供的一种数据关联性分析装置的结构示意图;
[0024]图7是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
[0025]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0026]本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
[0027]下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的数据关联性分析方法、装置、电子设备及可读存储介质进行详细地说明。
[0028]请参见图1,图1是本申请实施例提供的一种数据关联性分析方法的流程图,该方法应用于电子设备,如图1所示,该方法包括如下步骤:
[0029]步骤101:获取待分析样本数据。
[0030]本实施例中,待分析样本数据可选为结构化数据等。结构化数据也称作行数据,是由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范,主要通过关系型数据库进行存储和管理。
[0031]步骤102:确定待分析样本数据的预测特征和待分析样本数据的多个分析特征。
[0032]其中,预测特征为无序离散特征。每个分析特征可以为无序离散特征、有序离散特征和连续特征中的任意一者。
[0033]步骤103:计算预测特征与每个分析特征的目标相关系数。
[0034]本实施例中,目标相关系数可以表征预测特征与每个分析特征的相关性。具体来说,目标相关系数不仅可以表征连续特征之间的相关性,也可以更好的表征无序离散特征
与其它特征的相关性,即表征混合类型的特征之间的相关性,取值范围在[0,1]之间。
[0035]步骤104:根据预测特征与每个分析特征的目标相关系数,对多个分析特征进行处理。
[0036]一些实施例中,在对多个分析特征进行处理,获得处理结果后,可以由建模人员基于处理结果进行建模,即基于分析特征的信息,可以对相应预测特征的信息进行预测。
[0037]本申请实施例的数据关联性分析方法,在获取待分析样本数据之后,可以确定待分析样本数据的预测特征和待分析样本数据的多个分析特征,并计算预测特征与每个分析特征的目标相关系数,该预测特征为无序离散特征,该目标相关系数表征无序离散特征与每个分析特征的相关性,并根据预测特征与每个分析特征的目标相关系数,对多个分析特征进行处理。由此,可以更好的处理无序离散特征与其它特征的相关性,从而提升数据分析结果的准确性。
[0038]一些实施例中,若获取的待分析样本数据属于较大的数据集,可以根据每类预测特征的比例对待分析样本数据进行抽样,获得小数据集,并基于获得的小数据集进行数据关联性分析方法。例如,可以根据每类预测特征的样本数占样本总数的比例,计算每类预测特征需要抽样的样本数,然后根据计算的样本数进行抽样。
[0039]本申请实施例中,目标相关系数可选为Φ
K
相关系数,可以基于相应两两特征的卡方确定,以更好的表征无序离散特征与其它特征的相关性。上本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据关联性分析方法,应用于电子设备,其特征在于,包括:获取待分析样本数据;确定所述待分析样本数据的预测特征和所述待分析样本数据的多个分析特征;计算所述预测特征与每个所述分析特征的目标相关系数;其中,所述预测特征为无序离散特征,所述目标相关系数表征所述预测特征与每个所述分析特征的相关性;根据所述预测特征与每个所述分析特征的目标相关系数,对所述多个分析特征进行处理。2.根据权利要求1所述的方法,其特征在于,所述目标相关系数为Φ
K
相关系数,所述计算所述预测特征与每个所述分析特征的目标相关系数,包括:针对所述多个分析特征中的第一特征,计算所述预测特征与所述第一特征的卡方;其中,所述第一特征为所述多个分析特征中的任一分析特征;根据所述卡方,确定所述预测特征与所述第一特征的Φ
K
相关系数。3.根据权利要求1所述的方法,其特征在于,所述根据所述预测特征与每个所述分析特征的目标相关系数,对所述多个分析特征进行处理,包括:确定所述多个分析特征中的每个分析特征的信息;根据所述预测特征与每个所述分析特征的目标相关系数的从大到小的顺序,对所述多个分析特征的信息进行排序。4.根据权利要求1所述的方法,其特征在于,所述根据所述预测特征与每个所述分析特征的目标相关系数,对所述多个分析特征进行处理,包括:根据所述预测特征与每个所述分析特征的目标相关系数,从所述多个分析特征中选择M个目标连续特征;其中,所述M大于或等于2,所述M个目标连续特征对应的M个目标相关系数占所述多个分析特征对应的多个目标相关系数的前M位;确定所述M个目标连续特征中的每两个目标连续特征的关联性;展示所述每两个目标连续特征的关联性。5.根据权利要求4所述的方法,其特征在于,所述确定所述M个目标连续特征中的每两个目标连续特征的关联性,包括:计算所述每两个目标连续特征的皮尔逊相关系数;其中,所述展示所述每两个目标连续特征的关联性,包括:...

【专利技术属性】
技术研发人员:白一哲
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1