基于卷积神经网络的数据特征提取方法及系统技术方案

技术编号:26972300 阅读:20 留言:0更新日期:2021-01-06 00:04
本发明专利技术提供一种基于卷积神经网络的数据特征提取方法及系统,属于人工智能技术领域。该方法包括:根据多个数据指标生成预处理指标集,执行迭代处理:取出预处理指标集的头部数据指标后放入精细指标集末尾;根据头部数据指标从取出头部数据指标后的指标集中选取第二数据指标后放入精细指标集末尾;根据头部数据指标、第二数据指标和当前迭代次数从取出第二数据指标后的指标集中选取第三数据指标后放入精细指标集末尾;确定取出第三数据指标后的指标集为预处理指标集,继续执行迭代处理直至当前预处理指标集为空集;将精细指标集和执行迭代处理前的预处理指标集拼接为目标数据集后输入卷积神经网络中,可以高效便捷提取数据指标的有效数据特征。

【技术实现步骤摘要】
基于卷积神经网络的数据特征提取方法及系统
本专利技术涉及人工智能
,具体地,涉及一种基于卷积神经网络的数据特征提取方法及系统。
技术介绍
卷积神经网络是近年来被广泛重视的一种深度学习网络。传统的卷积神经网络主要利用了相邻区域内局部关联和权值共享等特性进行特征提取,相对于全连接神经网络可最大限度保留重要参数,过滤大量不重要参数。这种特征提取方式在计算机视觉领域使用广泛,能够尽大可能提取有用的高质量特征,避免对图像复杂的前期预处理,但在异位相关性数据(例如财务数据)分析领域应用卷积神经网络时则具有局限性。异位相关性数据为数据集内不同属性间的相关性与其存储空间中所在位置无关的数据。图像识别过程会根据图像像素形成数据,其特征提取较大依赖图像数据在存储空间中的物理位置;若数据相对位置发生变动,其原始特征也发生改变,因此图像数据不属于异位相关性数据。而财务数据不同指标之间的相关性与其存储空间中所在位置无关,若在指标维度上变动不同财务数据的相对位置,其相关性仍保持不变,因此财务数据为异位相关性数据。由于不同数据指标之间均有不同程度关联,提取特征过程中需要提取出指标间重要关联特征,而传统卷积方式仅针对局部进行卷积处理,易丢失部分关联特征,难以获取全局关联关系,造成有效特征提取不完整。因此在对异位相关性数据应用卷积神经网络时可能造成非局部间的数据关联信息丢失。
技术实现思路
本专利技术实施例的主要目的在于提供一种基于卷积神经网络的数据特征提取方法及系统,以高效便捷提取有效的数据特征,进而提高后续模型训练的精度和效率。为了实现上述目的,本专利技术实施例提供一种基于卷积神经网络的数据特征提取方法,包括:获取多个数据指标,根据多个数据指标生成预处理指标集;执行如下迭代处理:取出预处理指标集的头部数据指标后放入精细指标集的末尾;根据头部数据指标从取出头部数据指标后的指标集中选取第二数据指标,取出第二数据指标后放入精细指标集的末尾;根据头部数据指标、第二数据指标和当前迭代次数从取出第二数据指标后的指标集中选取第三数据指标,取出第三数据指标后放入精细指标集的末尾;确定取出第三数据指标后的指标集为预处理指标集,继续执行迭代处理,直至当前预处理指标集为空集;将精细指标集和执行迭代处理前的预处理指标集拼接为目标数据集;将目标数据集输入预先得到的卷积神经网络中,得到数据指标的数据特征。本专利技术实施例还提供一种基于卷积神经网络的数据特征提取系统,包括:预处理指标集单元,用于获取多个数据指标,根据多个数据指标生成预处理指标集;精细指标集单元,用于执行如下迭代处理:取出预处理指标集的头部数据指标后放入精细指标集的末尾;根据头部数据指标从取出头部数据指标后的指标集中选取第二数据指标,取出第二数据指标后放入精细指标集的末尾;根据头部数据指标、第二数据指标和当前迭代次数从取出第二数据指标后的指标集中选取第三数据指标,取出第三数据指标后放入精细指标集的末尾;确定取出第三数据指标后的指标集为预处理指标集,继续执行迭代处理,直至当前预处理指标集为空集;目标数据集单元,用于将精细指标集和执行迭代处理前的预处理指标集拼接为目标数据集;数据特征提取单元,用于将目标数据集输入预先得到的卷积神经网络中,得到数据指标的数据特征。本专利技术实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并在处理器上运行的计算机程序,处理器执行计算机程序时实现所述的基于卷积神经网络的数据特征提取方法的步骤。本专利技术实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现所述的基于卷积神经网络的数据特征提取方法的步骤。本专利技术实施例的基于卷积神经网络的数据特征提取方法及系统可以高效便捷提取有效的数据特征,避免重要异位相关性数据丢失,进而提高后续模型训练的精度和效率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术一实施例中基于卷积神经网络的数据特征提取方法的流程图;图2是本专利技术一实施例中生成精细指标集的流程图;图3是本专利技术一实施例中生成精细指标集的示意图;图4是本专利技术实施例中卷积的示意图;图5是本专利技术实施例中生成预处理指标集的流程图;图6是本专利技术另一实施例中生成精细指标集的流程图;图7是本专利技术一实施例中生成预处理指标集的示意图;图8是本专利技术实施例中确定指标关联度的流程图;图9是本专利技术具体实施例中得到财务造假识别结果的示意图;图10是本专利技术实施例中基于卷积神经网络的数据特征提取系统的结构框图;图11是本专利技术实施例中计算机设备的结构框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本领域技术人员知道,本专利技术的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。鉴于现有技术仅针对局部进行卷积处理,易丢失部分关联特征,难以获取全局关联关系,造成有效特征提取不完整,本专利技术实施例提供一种基于卷积神经网络的数据特征提取方法,以高效便捷提取有效的数据特征,进而提高后续模型训练的精度和效率。以下结合附图对本专利技术进行详细说明。为解决传统卷积网络应用于异位相关性数据特征提取流程中过度关注局部特征的不足,本专利技术提供了一种基于非局部分组卷积神经网络的数据特征提取方法来提高数据特征提取的质量,避免由于数据物理排布方式导致不同指标间重要关联特征丢失,同时避免因数据过度交叉产生数据冗余导致训练效率下降。本专利技术对异位相关性数据进行特征提取,具体利用了不同数据指标间具有不同程度关联的特性,通过对不同维度的数据进行交叉分组,使每个组合内形成临时局部数据,从而利用卷积网络局部数据特征提取的优势对分组进行特征提取,最终得到高质量的有效数据特征。非局部分组交叉卷积神经网络更适用异位相关性数据(例如财务数据)分析领域,是一种特定场景下更高效便捷的特征提取手段。为实现上述目的,本专利技术使用以下技术方案进行实现:1、对所需的数据按时间顺序进行整理,得到所有数据中可进行分析的数据指标。2、对时间序列上的数据指标进行相关性分析,分析各数据指标间的关联程度,将关联程度较低的指标进行依次排序,将排序后的数据指标作为预处理后的指标数据集。本文档来自技高网...

【技术保护点】
1.一种基于卷积神经网络的数据特征提取方法,其特征在于,包括:/n获取多个数据指标,根据所述多个数据指标生成预处理指标集;/n执行如下迭代处理:/n取出预处理指标集的头部数据指标后放入精细指标集的末尾;/n根据所述头部数据指标从取出头部数据指标后的指标集中选取第二数据指标,取出所述第二数据指标后放入所述精细指标集的末尾;/n根据所述头部数据指标、所述第二数据指标和当前迭代次数从取出第二数据指标后的指标集中选取第三数据指标,取出所述第三数据指标后放入所述精细指标集的末尾;/n确定取出第三数据指标后的指标集为预处理指标集,继续执行所述迭代处理,直至当前预处理指标集为空集;/n将所述精细指标集和执行迭代处理前的预处理指标集拼接为目标数据集;/n将所述目标数据集输入预先得到的卷积神经网络中,得到所述数据指标的数据特征。/n

【技术特征摘要】
1.一种基于卷积神经网络的数据特征提取方法,其特征在于,包括:
获取多个数据指标,根据所述多个数据指标生成预处理指标集;
执行如下迭代处理:
取出预处理指标集的头部数据指标后放入精细指标集的末尾;
根据所述头部数据指标从取出头部数据指标后的指标集中选取第二数据指标,取出所述第二数据指标后放入所述精细指标集的末尾;
根据所述头部数据指标、所述第二数据指标和当前迭代次数从取出第二数据指标后的指标集中选取第三数据指标,取出所述第三数据指标后放入所述精细指标集的末尾;
确定取出第三数据指标后的指标集为预处理指标集,继续执行所述迭代处理,直至当前预处理指标集为空集;
将所述精细指标集和执行迭代处理前的预处理指标集拼接为目标数据集;
将所述目标数据集输入预先得到的卷积神经网络中,得到所述数据指标的数据特征。


2.根据权利要求1所述的基于卷积神经网络的数据特征提取方法,其特征在于,根据所述多个数据指标生成预处理指标集包括:
根据所述多个数据指标生成原始指标集;
从所述原始指标集中随机取出其中一个数据指标,确定该数据指标为基准指标,执行如下迭代处理:
将所述基准指标放入所述预处理指标集的末尾;
确定取出基准指标后的原始指标集中与该基准指标的关联度最低的数据指标为基准指标,继续执行所述迭代处理,直至所述原始指标集为空集。


3.根据权利要求1所述的基于卷积神经网络的数据特征提取方法,其特征在于,根据所述头部数据指标从取出头部数据指标后的指标集中选取第二数据指标包括:
确定所述预处理指标集中与所述头部数据指标相距最远的指标作为第二数据指标;
从取出头部数据指标后的指标集中选取第二数据指标。


4.根据权利要求2所述的基于卷积神经网络的数据特征提取方法,其特征在于,还包括:
确定该基准指标与取出基准指标后的原始指标集中各个数据指标之间的协方差;
确定该基准指标的方差和各个数据指标的方差;
根据该基准指标与各个数据指标之间协方差、该基准指标的方差和各个数据指标的方差,确定取出基准指标后的原始指标集中各个数据指标与该基准指标的关联度。


5.一种基于卷积神经网络的数据特征提取系统,其特征在于,包括:
预处理指标集单元,用于获取多个数据指标,根据所述多个数据指标生成预处理指标集;
精细指标集单元,用于执行如下迭代处理:
取出预处理指标...

【专利技术属性】
技术研发人员:赵傲姜嘉祺王飞童俊
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1