数据特征提取的方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:19342059 阅读:31 留言:0更新日期:2018-11-07 13:51
本申请揭示了本申请的数据特征提取的方法、装置、计算机设备和存储介质,用于对区块链上的数据进行数据特征提取,其中方法包括:获取区块链上的原始数据;将所述原始数据输入到CCIPCA算法中计算所述原始数据的特征数据。本申请利用数据是区块链上下载的,其无法篡改的特性,所以在数据特征提取的过程中并没有进行离散点处理的过程,而使用CCIPCA算法直接进行数据特征提取,数据特征提取更快。

Data feature extraction method, device, computer equipment and storage medium

This application discloses the data feature extraction method, device, computer equipment and storage medium of the application for data feature extraction on block chains. The methods include: obtaining the original data on block chains; inputting the original data into CCIPCA algorithm to calculate the characteristic number of the original data. According to it. This application takes advantage of the fact that data is downloaded from block chains and can not be tampered with, so there is no process of discrete point processing in the process of data feature extraction. The CCIPCA algorithm is used to extract data features directly, and the data feature extraction is faster.

【技术实现步骤摘要】
数据特征提取的方法、装置、计算机设备和存储介质
本申请涉及到计算机
,特别是涉及到一种数据特征提取的方法、装置、计算机设备和存储介质。
技术介绍
区块链是一种去中心化、无需信任的新型数据架构,它由网络中所有的节点共同拥有、管理和监督,不接受单一方面的控制。区块链是一个刚刚兴起的技术,各企业正在做前期的技术研发和发展布局,所以对区块链上的数据进行分析是一个必要的过程,但是随着区块链上的数据日益增多,如何快速地提取区块链上的原始数据的特征数据,是亟需解决的问题。
技术实现思路
本申请的主要目的为提供一种数据特征提取的方法、装置、计算机设备和存储介质,旨在可以快速提取区块链上的原始数据的特征数据。本申请提出一种数据特征提取的方法,用于对区块链上的数据进行数据特征提取,所述方法包括:获取区块链上的原始数据;将所述原始数据输入到CCIPCA算法中计算所述原始数据的特征数据。进一步地,所述将所述原始数据输入到CCIPCA算法中计算所述原始数据的特征数据的步骤,包括:对所述原始数据进行加窗处理;将窗口内的原始数据输入到CCIPCA算法中计算所述原始数据的特征数据。进一步地,所述将所述原始数据输入到CCIPCA算法中计算所述原始数据的特征数据的步骤,包括:将获取的所述原始数据存入到缓存区;将缓存区内的原始数据分批次地输入所述CCIPCA算法中,当一个批次的原始数据输入完毕后,开始进行迭代计算,得到所述原始数据的特征数据。进一步地,所述将所述原始数据输入到CCIPCA算法中计算所述原始数据的特征数据的步骤,包括:在CCIPCA算法计算时,对于第一个待求的特征数据,先输入第一个样本进行计算直到其收敛,对后面的输入样本计算残差以计算后一个特征数据,并以此类推,逐个计算特征数据。进一步地,所述将所述原始数据输入到CCIPCA算法中计算所述原始数据的特征数据的步骤之后,包括:将获取到的特征数据分批次地进行相关矩阵分析;将同一批次中与该批次内的其它特征数据不相关的不相关特征数据,按照预设规则进行处理。进一步地,所述将所述原始数据输入到CCIPCA算法中计算所述原始数据的特征数据的步骤之后,包括:将输出的特征数据实时地添加到可视化的散点图中。进一步地,所述将所述原始数据输入到CCIPCA算法中计算所述原始数据的特征数据的步骤之后,包括:对输出的特征数据进行分类;将分类后的特征数据输入到对应的运算模型进行计算。本申请还提供一种数据特征提取的装置,用于对区块链上的数据进行数据特征提取,所述装置包括:获取单元,用于获取区块链上的原始数据;特征提取单元,用于将所述原始数据输入到CCIPCA算法中计算所述原始数据的特征数据。本申请还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。本申请还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。本申请的数据特征提取的方法、装置、计算机设备和存储介质,利用数据是区块链上下载的,其无法篡改的特性,所以在数据特征提取的过程中并没有进行离散点处理的过程,而使用CCIPCA算法直接进行数据特征提取,数据特征提取更快。附图说明图1为本申请一实施例的数据特征提取的方法的流程示意图;图2为本申请一实施例的数据特征提取的方法的流程示意图;图3为本申请一实施例的数据特征提取的方法的流程示意图;图4为本申请一实施例的数据特征提取的方法的流程示意图;图5为本申请一实施例的数据特征提取的装置的结构示意框图;图6为本申请一实施例的特征提取单元的结构示意框图;图7为本申请一实施例的特征提取单元的结构示意框图;图8为本申请一实施例的特征提取单元的结构示意框图;图9为本申请一实施例的数据特征提取的装置的结构示意框图;图10为本申请一实施例的数据特征提取的装置的结构示意框图;图11为本申请一实施例的数据特征提取的装置的结构示意框图;图12为本申请一实施例的计算机设备的结构示意框图。本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。参照图1,本申请实施例提出一种数据特征提取的方法,用于对区块链上的数据进行数据特征提取,所述方法包括:S1、获取区块链上的原始数据;S2、将所述原始数据输入到CCIPCA算法中计算所述原始数据的特征数据。如上述步骤S1所述,上述的原始数据是指从区块链上直接下载下来的数据,未经过任何数据处理的数据。从区块链上获取原始数据的方法包括,输入待下载的数据的关键字、关键词等检索词,然后将与检索词相关的数据下载下来。在其它实施例中,还可以设置区块下载,即指定区块只要有数据更新,即会将更新的数据下载下来,以达到实时分析处理的高效性。上述区块是指某一指定领域或某一企业的区块。如上述步骤S2所述,上述CCIPCA(无偏协方差无关增量主成分分析,CandidCovariance-freeIncrementalPrincipalComponentAnalysis)算法,可用于在线数据流降维的处理,该算法对数据流中的异常点较为敏感,降维精度受异常点的影响较大。本实施例中,充分利用区块链上的数据不会被篡改的产生的特点,所以在用CCIPCA算法降维之前无需进行离群点处理的过程,提高提取数据特征的效率。本实施例中,上述CCIPCA算法中计算所述原始数据的特征数据的具体过程如下:假设数据流按样本向量u(1),u(2),…收集,向量可能无限大。每个u(n),n=1,2,…,是一个d维向量。不失一般性,假设u(n)的均值为0。A={u(n)uT(n)}是一个dxd维的协方差矩阵,T代表矩阵转置。采用增量更新的方式计算协方差矩阵:令v(0)=v(1),即数据分布的第一个方向,ν代表协方差矩阵。对于增量估计,上式可以写成一种递归的形式:其中,v=λx为样本协方差矩阵,特征向量X和特征值λ可分别计算x=v/||v||和λ=||v||得到。由以上得到的是第一阶向量,第二阶向量如下:其中,u1(n)=u(n),在完备空间中,u2(n)被用作下一迭代的输入。本实施例中,上述将所述原始数据输入到CCIPCA算法中计算所述原始数据的特征数据的步骤S2,包括:S21、对所述原始数据进行加窗处理;S22、将窗口内的原始数据输入到CCIPCA算法中计算所述原始数据的特征数据。如上述步骤S21和S22所述,上述加窗处理是指在数据上加一个滑动窗口,用于将部分历史数据丢弃,只处理滑动窗口内的数据,使本申请更关注于新数据的特征提取,以达到实时处理的效果。本申请中,加入滑动窗口之后,虽然对于特征提取的精准度有一定的影响,但是减少对历史数据的依赖性,可以大大地降低计算量,进而提高对实时获取的原始数据进行特征提取的速度。在一个实施例中,上述将所述原始数据输入到CCIPCA算法中计算所述原始数据的特征数据的步骤S2,包括:S201、将获取的所述原始数据存入到缓存区;S202、将缓存区内的原始数据分批次地输入所述本文档来自技高网...

【技术保护点】
1.一种数据特征提取的方法,其特征在于,用于对区块链上的数据进行数据特征提取,所述方法包括:获取区块链上的原始数据;将所述原始数据输入到CCIPCA算法中计算所述原始数据的特征数据。

【技术特征摘要】
1.一种数据特征提取的方法,其特征在于,用于对区块链上的数据进行数据特征提取,所述方法包括:获取区块链上的原始数据;将所述原始数据输入到CCIPCA算法中计算所述原始数据的特征数据。2.根据权利要求1所述的数据特征提取的方法,其特征在于,所述将所述原始数据输入到CCIPCA算法中计算所述原始数据的特征数据的步骤,包括:对所述原始数据进行加窗处理;将窗口内的原始数据输入到CCIPCA算法中计算所述原始数据的特征数据。3.根据权利要求1所述的数据特征提取的方法,其特征在于,所述将所述原始数据输入到CCIPCA算法中计算所述原始数据的特征数据的步骤,包括:将获取的所述原始数据存入到缓存区;将缓存区内的原始数据分批次地输入所述CCIPCA算法中,当一个批次的原始数据输入完毕后,开始进行迭代计算,得到所述原始数据的特征数据。4.根据权利要求1所述的数据特征提取的方法,其特征在于,所述将所述原始数据输入到CCIPCA算法中计算所述原始数据的特征数据的步骤,包括:在CCIPCA算法计算时,对于第一个待求的特征数据,先输入第一个样本进行计算直到其收敛,对后面的输入样本计算残差以计算后一个特征数据,并以此类推,逐个计算特征数据。5.根据权利要求1所述的数据特征提取的方法,其特征在于,所述将所述原始数据输...

【专利技术属性】
技术研发人员:王义文王健宗肖京
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1