The embodiment of the present invention provides a structured data classification method, device, electronic equipment and storage medium, in which the structured data classification method includes: acquiring structured data to be classified; inputting the structured data to be classified into a pre-trained convolutional neural network model to obtain the structured data to be classified. Data classification results, in which the convolutional neural network model includes a full connection layer and a convolutional neural sub-network, and the full connection layer is the first layer of the convolutional neural network model. This scheme can improve the accuracy of classification of structured data by convolution neural network model.
【技术实现步骤摘要】
一种结构化数据分类方法、装置、电子设备及存储介质
本专利技术涉及数据处理
,特别是涉及一种结构化数据分类方法、装置、电子设备及存储介质。
技术介绍
结构化数据一般是指存储在数据库中,具有一定逻辑结构和物理结构的数据,该类数据一般可以用二维表结构来表达,例如,一份患者的血常规检验报告,其中包含有:白细胞数量、红细胞数量、血小板数量及淋巴细胞百分率等数据,上述数据即为结构化数据。医生通过对上述检验报告中结构化数据的分析,可以判断出患者是否患有某种疾病,这一过程则是对结构化数据进行分类的过程,分类的对象为上述包含结构化数据的检验报告样本,分类结果为该患者患有某种疾病或者未患有某种疾病。多层感知器(Multi-layerPerceptions,MLP)是人工神经网络家族中常用来进行数据分类的机器学习算法。MLP所有的层都是全连接层,全连接层对数据中的局部特征不敏感。所以不管是具有局部特征的非结构化数据还是不具有局部特征的结构化数据,对于MLP来说分类性能都是一样的。卷积神经网络(ConvolutionalNeuralNetworks,CNN)对MLP进行了改进,提出了具有局部连接的卷积层。卷积层可以提取出数据中的局部特征,然后通过网络的多层结构,对上述特征进行组合,得到具有更高可区分性的特征,从而依据这些特征提高对具有局部特征数据的分类。所以传统的卷积神经网络对具有局部特征的数据(比如图像数据)相较于MLP具有明显的性能提升。但是,结构化数据本身是不具有局部特征的,因此,相对于MLP,无法直接通过传统的卷积神经网络模型提高对结构化数据的分类准确率。专利技术内 ...
【技术保护点】
1.一种结构化数据分类方法,其特征在于,包括:获取待分类结构化数据;将所述待分类结构化数据输入预先训练得到的卷积神经网络模型,得到所述待分类结构化数据的分类结果,其中,所述卷积神经网络模型包括全连接层及卷积神经子网络,所述全连接层为所述卷积神经网络模型中的第一层。
【技术特征摘要】
1.一种结构化数据分类方法,其特征在于,包括:获取待分类结构化数据;将所述待分类结构化数据输入预先训练得到的卷积神经网络模型,得到所述待分类结构化数据的分类结果,其中,所述卷积神经网络模型包括全连接层及卷积神经子网络,所述全连接层为所述卷积神经网络模型中的第一层。2.根据权利要求1所述的方法,其特征在于,所述卷积神经子网络为一维卷积神经子网络;所述卷积神经网络模型的训练方式,包括:获取结构化数据样本集,所述结构化数据样本集中包含多个结构化数据样本;针对每个结构化数据样本,进行如下操作:将该结构化数据样本输入所述全连接层,得到第一过渡样本;将所述第一过渡样本输入所述一维卷积神经子网络,得到神经网络输出;基于所述神经网络输出和所述该结构化数据样本间的差异,对所述全连接层和所述一维卷积神经子网络进行训练,得到所述卷积神经网络模型。3.根据权利要求1所述的方法,其特征在于,所述卷积神经子网络为一维卷积神经子网络;所述卷积神经网络模型的训练方式,包括:获取结构化数据样本集,所述结构化数据样本集中包含多个结构化数据样本;基于所述结构化数据样本集,通过softmax损失函数进行参数调整,训练所述全连接层;将所述结构化数据样本集中的各结构化数据样本分别输入训练后的全连接层,得到第一过渡数据样本集;基于所述第一过渡数据样本集,训练所述一维卷积神经子网络;基于所述结构化数据样本集,对由训练后的全连接层和训练后的一维卷积神经子网络组成的第一过渡网络模型进行训练,得到卷积神经网络模型。4.根据权利要求1所述的方法,其特征在于,所述卷积神经子网络为二维卷积神经子网络;所述卷积神经网络模型中还包括变形层;所述卷积神经网络模型的训练方式,包括:获取结构化数据样本集,所述结构化数据样本集中包含多个结构化数据样本;建立与所述结构化数据样本对应的二维图像数据,并将所述二维图像数据展开为一维图像数据;针对每个结构化数据样本,进行如下操作:将该结构化数据样本输入所述全连接层,得到第二过渡样本;将所述第二过渡样本输入所述变形层,得到第三过渡样本;将所述第三过渡样本输入所述二维卷积神经子网络,得到神经网络输出;基于所述第二过渡样本和所述一维图像数据间的差异、所述神经网络输出和所述该结构化数据样本间的差异,对所述全连接层和所述二维卷积神经子网络进行训练,得到所述卷积神经网络模型。5.根据权利要求1所述的方法,其特征在于,所述卷积神经子网络为二维卷积神经网络模型;所述卷积神经网络模型中还包括变形层;所述卷积神经网络模型的训练方式,包括:获取结构化数据样本集,所述结构化数据样本集中包含多个结构化数据样本;建立与所述结构化数据样本对应的二维图像数据,并将所述二维图像数据展开为一维图像数据;基于所述结构化数据样本集及所述一维图像数据,通过均方差损失函数进行参数调整,训练所述全连接层;将所述结构化数据样本集中的各结构化数据样本分别输入训练后的全连接层,得到第二过渡数据样本集;将所述第二过渡数据样本集中的样本分别输入所述变形层,得到第三过渡样本集;基于所述第三过渡数据样本集,训练所述二维卷积神经子网络;基于所述结构化数据样本集及所述一维图像数据,对由训练后的全连接层及训练后的二维卷积神经子网络组成的第二过渡网络模型进行训练,得到卷积神经网络模型。6.根据权利要求1所述的方法,其特征在于,所述卷积神经网络模型中包括第一子网络模型、第二子网络模型、第三子网络模型和第四子网络模型;其中,所述第一子网络模型和所述第二子网络模型的...
【专利技术属性】
技术研发人员:刘奎,康桂霞,张宁波,侯蓓蓓,
申请(专利权)人:北京邮电大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。