System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种数据处理方法、装置、存储系统及计算机可读存储介质制造方法及图纸_技高网

一种数据处理方法、装置、存储系统及计算机可读存储介质制造方法及图纸

技术编号:40974775 阅读:3 留言:0更新日期:2024-04-18 21:23
本发明专利技术公开了一种数据处理方法、装置、存储系统及计算机可读存储介质,本发明专利技术涉及数据处理技术领域,解决了不同数据之间未进行详细分类,会导致部分不相关的数据存储于同一存储空间位置处,导致存储的数据较为混乱的问题,本发明专利技术通过对数据进行去重处理后,再剔除内部的异常数据,针对于不同的标准化数据,对其进行相似度分析,将不同的标准化数据转变为标准向量,再分析不同向量之间的向量特征,来确定其对应标准化数据的具体特征,以此将不同的标准化数据进行分类,从而使不同的标准化数据均能得到相应的分类以及区分,将具备相似特征的数据存储于一处,便于后续对数据进行分析整理时,其处理效率更好,存储的整体效果更好。

【技术实现步骤摘要】

本专利技术涉及数据处理,具体为一种数据处理方法、装置、存储系统及计算机可读存储介质


技术介绍

1、首先进行数据收集,涉及到从不同的数据源和方式收集数据,为后续处理做准备,再进行数据预处理:这一步骤是确保数据质量的关键,主要包括以下几个方面:

2、数据清理:通过填补缺失值、光滑噪声数据、删除离群点以及解决数据不一致性来“清理”数据;

3、数据集成:将来自多个源的数据合并在一起,形成一个一致的数据集合;

4、数据规约:减少数据量,但保持数据的完整性,以提高处理效率;

5、数据变换:将数据转换成适合分析的格式,例如将分类数据数字化;

6、数据存储:将处理后的数据存储在适当的介质中,以便于后续的访问和分析。

7、公开号为cn114840356b的申请提供一种数据处理方法、数据处理系统及相关装置,涉及数据处理领域,包括:获取至少为预设长度的共享数据;将共享数据载入多维化数据空间的共享区域;在共享区域中建立共享数据的多维数据映射,以便各进程构建对多维数据映射的共享数据访问链表;监听各进程对多维数据映射的更新请求,并在进程内部生成变更预处理队列;判断更新请求是否可通过变更坐标映射完成;若是,通过变更共享数据访问链表完成更新请求;若否,拒绝更新请求,并在进程内新建本地变量,并在更新队列中暂存更新请求。本申请可以基于不同维度同时进行操作,避免出现共享数据的占用冲突,提升数据的加密强度和逻辑处理能力。

8、数据在进行处理过程中,因数据所占容量较大,会导致对应数据在处理时,其数据的精度以及结果准度受到相应影响,且数据在存储时,不同数据之间未进行详细分类,会导致部分不相关的数据存储于同一存储空间位置处,导致存储的数据之间较为混乱,不能达到较好的数据处理效果。


技术实现思路

1、针对现有技术的不足,本专利技术提供了一种数据处理方法、装置、存储系统及计算机可读存储介质,解决了不同数据之间未进行详细分类,会导致部分不相关的数据存储于同一存储空间位置处,导致存储的数据较为混乱的问题。

2、为实现以上目的,本专利技术通过以下技术方案予以实现:一种数据处理方法,包括以下步骤:

3、s1、确认本阶段的处理数据并进行初步清理,优先删除处理数据内部的重复数据,再锁定异常数据,并将本处理数据内部的异常数据进行删除,从而通过处理数据得到标准化数据,包括:

4、将本阶段需要进行处理的数据进行确定,从所确定的数据中存在完成相同的数据,并删除重复数据,保留其中一组数据,处理完毕后,确认二阶段处理数据;

5、对二阶段处理数据的结果参数按照从小至大的方式进行排列,生成一组参数序列,将本参数序列按照结果参数的个数划分为四等份,若无法完成四等份,则保持中间两等份的结果参数个数一致;

6、获取第二等份的首位参数,将其标定为ss,再确认第三等份的末位参数,将其标定为ms,再确认ms与ss之间的差值cz:cz=ms-ss,基于所确定的差值cz确定一组数值区间:[cz-1.5×cz,cz+1.5×cz],将本参数序列内不属于此数值区间的数据标定为异常数据,并从处理数据中剔除此异常数据,以此得到标准化数据;

7、s2、针对于不同阶段的标准化数据,进行相似度分析,将不同的标准化数据转变为标准向量,再通过分析不同标准化数据的不同标准向量,来确定对应标准化数据的相应特征,以此将不同阶段的标准化数据进行数据分类,并将属于相同分类的标准化数据存储于同一空间处,包括:

8、依据操作人员的实操经验,从标准化数据内提取三组不同的特征值,其特征值属于此标准化数据的相关属性数据;

9、依据不同标准化数据内所对应的不同特征值,按照选定顺序,从三维坐标系内确定对应的空间点位,再从原点出发至空间点位的所在位置,生成此标准数据的标准向量;

10、从三维坐标系内确定一组基准线,此基准线位于x轴、y轴及z轴之间,且基准线分别与x轴、y轴及z轴的夹角角度一致,确定标准向量与基准线之间的夹角a,再对其他阶段的标准化数据进行向量化处理,并确定与基准线之间的夹角ai,其中i代表不同阶段的标准化数据;

11、依据所确定的夹角ai以及预设的角度区间,将属于同一角度区间的标准向量划分为同区间向量,其中角度区间为预设区间;

12、再对同区间向量的标准向量长度进行分类,根据预设值ys构建若干组长度分类区间:(0,ys]、(ys,2ys]、……、((n-1)ys,nys],其中ys为预设值,且n代表对应长度分类区间的个数,依据不同标准向量的长度,将同区间向量的若干个标准向量划分至若干个不同长度分类区间内,依据划分结果,将同区间向量对应的标准化数据存储于同一主空间内,再将主空间划分为n个次空间,再依次将不同长度分类区间所对应的标准化数据存储至相应的次空间内;

13、s3、针对于存储于同一空间的标准化数据,首先进行数据统一去重处理,对本空间的重复数据采用重复标记进行替换,再对同一存储空间的标准化数据进行加密处理,确定加密逻辑式,并保留至对应存储空间内,对数据进行统一去重处理的具体方式包括:

14、首先确认同一次空间内若干个标准化数据的重复数据,将所确认的若干组重复数据采用对应的重复标记进行替换,其重复标记的表现形式为:ck,其中k=1、2、……、m,m代表重复数据的个数;

15、采用重复标记ck对标准化数据内所出现的若干个重复数据进行依次替换,并在替换完成后,生成重复数据标记替换表,并将替换后的主空间标定为待加密空间;

16、对待加密空间进行加密处理的具体方式包括:

17、首先确认对应次空间所对应的主空间的加密密钥,并将加密密钥标定为jm;

18、再依据对应主空间内次空间在构建过程中的时间先后顺序,对次空间进行初排序,对不同次空间内其数据的容量按照排序方式标定为rt,其中t=1、2、……、g,其中g代表对应次空间的总个数,t为1时,代表此次空间位于主空间内排序位置处的第一位;

19、采用|r1-r2|+|r2-r3|+……+|rg-1-rg|=hb得到若干个次空间其容量差值的合并值hb;

20、通过合并值以及加密密钥采用(hb-jm)得到中间值zz,并在本主空间内设置逻辑式,其逻辑式为:y=hb-zz,并删除本主空间的加密密钥jm,当本主空间内次空间的容量值发生变化时,那么其中间值zz便发生相应变化。

21、优选的,一种数据处理装置,包括:

22、至少三组处理器:

23、第一处理器优先删除处理数据内部的重复数据,再锁定异常数据,并将本处理数据内部的异常数据进行删除,从而通过处理数据得到标准化数据;

24、第二处理器针对于不同阶段的标准化数据,进行相似度分析,将不同的标准化数据转变为标准向量,再通过分析不同标准化数据的不同标准向量,来确定对应标准化数据的相应特征,以此将不同阶段的标准化数据进本文档来自技高网...

【技术保护点】

1.一种数据处理方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种数据处理方法,其特征在于,所述步骤S1中,通过处理数据得到标准化数据的具体子步骤包括:

3.根据权利要求2所述的一种数据处理方法,其特征在于,所述步骤S2中,将不同阶段的标准化数据进行数据分类的子步骤包括:

4.根据权利要求3所述的一种数据处理方法,其特征在于,所述步骤S3中,对数据进行统一去重处理的具体方式包括:

5.根据权利要求4所述的一种数据处理方法,其特征在于,所述步骤S3中,对待加密空间进行加密处理的具体方式包括:

6.一种数据处理装置,该处理装置基于权利要求1-5任一项所述的处理方法进行运行,其特征在于,包括:

7.一种数据存储系统,该存储系统对权利要求1-5任一项所述的处理方法所产生的标准化数据进行存储,其特征在于,该存储系统对所产生的标准化数据进行存储,依据数据的具体分类,将不同分类的标准化数据存储于不同存储空间位置处,其中存储空间包括若干个主空间,且一个主空间内包括若干个次空间;

【技术特征摘要】

1.一种数据处理方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种数据处理方法,其特征在于,所述步骤s1中,通过处理数据得到标准化数据的具体子步骤包括:

3.根据权利要求2所述的一种数据处理方法,其特征在于,所述步骤s2中,将不同阶段的标准化数据进行数据分类的子步骤包括:

4.根据权利要求3所述的一种数据处理方法,其特征在于,所述步骤s3中,对数据进行统一去重处理的具体方式包括:

5.根据权利要求4所述的一种数据处理...

【专利技术属性】
技术研发人员:请求不公布姓名
申请(专利权)人:瑞达可信安全技术广州有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1