一种数据处理方法、装置、设备及介质制造方法及图纸

技术编号：38493100 阅读：11 留言：0更新日期：2023-08-15 17:05

本发明专利技术涉及数据处理领域，具体为一种数据处理方法、装置、设备及介质，其包括以下步骤：S1、收集数据；S2、判断数据特征Features(X)；S3、根据Y(X)的情况，选择合适的数据特征指标，根据不同的判断指标判断数据类型、规模和特征；S4、根据S3中判断出的数据类型、规模和特征，选取不同的数据处理方式；S5、数据处理的可视化展示。本发明专利技术根据数据的初步类型判断即可快速确定采用的判断特征，从而快速判断出数据的类型，便于后续选择最合适的处理方式进行处理，有助于提高数据处理的效果和效率。有助于提高数据处理的效果和效率。有助于提高数据处理的效果和效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据处理方法、装置、设备及介质

[0001]本专利技术涉及数据处理
，尤其涉及一种数据处理方法、装置、设备及介质。

技术介绍

[0002]数据处理是对数据的采集、存储、检索、加工、变换和传输的过程。根据处理设备的结构方式、工作方式，以及数据的时间空间分布方式的不同，数据处理有多种不同的方式。
[0003]授权公告号为CN115685948A的中国专利公开了一种数据处理方法、装置、设备及介质。该专利技术通过基于预先生成的目标筛选策略所包括的多个数据筛选维度，获取各个数据筛选维度所对应的筛选参数，从而基于多个数据筛选维度以及各个数据筛选维度所对应的筛选参数，从目标数据库中获取多个待处理数据集，进而基于多个待处理数据集，通过目标数据处理模型，生成包括多个数据节点的目标控制图，无需用户手动查找需要分析的数据，操作简便，提高了数据筛选效率。
[0004]但是上述已公开方案存在如下不足之处：数据处理模型及处理方法固定，无法针对不同类型、不同规模、不同特征的数据进行区分处理，容易影响数据处理的效果和效率，往往只能运用在特定场合和领域，使用局限性较大。

技术实现思路

[0005]本专利技术目的是针对
技术介绍
中存在的不能针对不同类型、不同规模、不同特征的数据进行区分处理的问题，提出一种数据处理方法、装置、设备及介质。
[0006]一方面，本专利技术提出一种数据处理方法，包括以下步骤：
[0007]S1、收集数据；
[0008]S2、判断数据特征Features(X)，<...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法，其特征在于，包括以下步骤：S1、收集数据；S2、判断数据特征Features(X)，，X是一个n维样本数据组成的矩阵，其中第i个样本的j个特征值为X(i,j)，表示平均值，Med(X)表示中位数，Std(X)表示数据的离散程度，CV(X)表示数据的变异系数，Min(X)和Max(X)分别表示最小值和最大值，Q1(X)、Q2(X)和Q3(X)分别表示数据的上四分位数、中位数和下四分位数，Range(X)表示极差，Skewness(X)表示数据分布的不对称程度，Kurtosis(X)表示数据分布的平顶程度，Y(X)表示数据的初步类型判断，Y(X)由使用者人为输入，Features(X)为上述多个指标的列表；S3、根据Y(X)的情况，选择合适的数据特征指标，根据不同的判断指标判断数据类型、规模和特征；S4、根据S3中判断出的数据类型、规模和特征，选取不同的数据处理方式；S5、数据处理的可视化展示。2.根据权利要求1所述的数据处理方法，其特征在于，S1中，收集数据方式有手动输入数据和自动采集上传数据。3.根据权利要求1所述的数据处理方法，其特征在于，S2中，Y(X)包括分类数据，数值型数据，数据分布偏斜，小样本数据，大样本数据，模型评估效果预测数据和数据相关性。4.根据权利要求3所述的数据处理方法，其特征在于，Y(X)为分类数据时，Features(X)的判断特征采用频率和百分比，频率直接统计即可不需要计算公式；Y(X)为数值型数据时，Features(X)的判断特征采用平均值和中位数；Y(X)为分数据分布偏斜时，Features(X)的判断特征采用中位数、上四...

【专利技术属性】
技术研发人员：许舒颜，
申请(专利权)人：安徽炽热信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人