一种结构化数据分类方法、装置、电子设备及存储介质制造方法及图纸

技术编号:19343839 阅读:25 留言:0更新日期:2018-11-07 14:31
本发明专利技术实施例提供了一种结构化数据分类方法、装置、电子设备及存储介质,其中,结构化数据分类方法包括:获取待分类结构化数据;将所述待分类结构化数据输入预先训练得到的卷积神经网络模型,得到所述待分类结构化数据的分类结果,其中,所述卷积神经网络模型包括全连接层及卷积神经子网络,所述全连接层为所述卷积神经网络模型中的第一层。通过本方案可以提高卷积神经网络模型对结构化数据分类的准确率。

A structured data classification method, device, electronic device and storage medium

The embodiment of the present invention provides a structured data classification method, device, electronic equipment and storage medium, in which the structured data classification method includes: acquiring structured data to be classified; inputting the structured data to be classified into a pre-trained convolutional neural network model to obtain the structured data to be classified. Data classification results, in which the convolutional neural network model includes a full connection layer and a convolutional neural sub-network, and the full connection layer is the first layer of the convolutional neural network model. This scheme can improve the accuracy of classification of structured data by convolution neural network model.

【技术实现步骤摘要】
一种结构化数据分类方法、装置、电子设备及存储介质
本专利技术涉及数据处理
,特别是涉及一种结构化数据分类方法、装置、电子设备及存储介质。
技术介绍
结构化数据一般是指存储在数据库中,具有一定逻辑结构和物理结构的数据,该类数据一般可以用二维表结构来表达,例如,一份患者的血常规检验报告,其中包含有:白细胞数量、红细胞数量、血小板数量及淋巴细胞百分率等数据,上述数据即为结构化数据。医生通过对上述检验报告中结构化数据的分析,可以判断出患者是否患有某种疾病,这一过程则是对结构化数据进行分类的过程,分类的对象为上述包含结构化数据的检验报告样本,分类结果为该患者患有某种疾病或者未患有某种疾病。多层感知器(Multi-layerPerceptions,MLP)是人工神经网络家族中常用来进行数据分类的机器学习算法。MLP所有的层都是全连接层,全连接层对数据中的局部特征不敏感。所以不管是具有局部特征的非结构化数据还是不具有局部特征的结构化数据,对于MLP来说分类性能都是一样的。卷积神经网络(ConvolutionalNeuralNetworks,CNN)对MLP进行了改进,提出了具有局部连接的卷积层。卷积层可以提取出数据中的局部特征,然后通过网络的多层结构,对上述特征进行组合,得到具有更高可区分性的特征,从而依据这些特征提高对具有局部特征数据的分类。所以传统的卷积神经网络对具有局部特征的数据(比如图像数据)相较于MLP具有明显的性能提升。但是,结构化数据本身是不具有局部特征的,因此,相对于MLP,无法直接通过传统的卷积神经网络模型提高对结构化数据的分类准确率。专利技术内容本专利技术实施例的目的在于提供一种结构化数据分类方法、装置、电子设备及存储介质,以提高卷积神经网络模型对结构化数据分类的准确率。具体技术方案如下:第一方面,本专利技术实施例提供了一种结构化数据分类方法,所述方法包括:获取待分类结构化数据;将所述待分类结构化数据输入预先训练得到的卷积神经网络模型,得到所述待分类结构化数据的分类结果,其中,所述卷积神经网络模型包括全连接层及卷积神经子网络,所述全连接层为所述卷积神经网络模型中的第一层。进一步的,所述卷积神经子网络为一维卷积神经子网络;所述卷积神经网络模型的训练方式,包括:获取结构化数据样本集,所述结构化数据样本集中包含多个结构化数据样本;针对每个结构化数据样本,进行如下操作:将该结构化数据样本输入所述全连接层,得到第一过渡样本;将所述第一过渡样本输入所述一维卷积神经子网络,得到神经网络输出;基于所述神经网络输出和所述该结构化数据样本间的差异,对所述全连接层和所述一维卷积神经子网络进行训练,得到所述卷积神经网络模型。进一步的,所述卷积神经子网络为一维卷积神经子网络;所述卷积神经网络模型的训练方式,包括:获取结构化数据样本集,所述结构化数据样本集中包含多个结构化数据样本;基于所述结构化数据样本集,通过softmax损失函数进行参数调整,训练所述全连接层;将所述结构化数据样本集中的各结构化数据样本分别输入训练后的全连接层,得到第一过渡数据样本集;基于所述第一过渡数据样本集,训练所述一维卷积神经子网络;基于所述结构化数据样本集,对由训练后的全连接层和训练后的一维卷积神经子网络组成的第一过渡网络模型进行训练,得到卷积神经网络模型。进一步的,所述卷积神经子网络为二维卷积神经子网络;所述卷积神经网络模型中还包括变形层;所述卷积神经网络模型的训练方式,包括:获取结构化数据样本集,所述结构化数据样本集中包含多个结构化数据样本;建立与所述结构化数据样本对应的二维图像数据,并将所述二维图像数据展开为一维图像数据;针对每个结构化数据样本,进行如下操作:将该结构化数据样本输入所述全连接层,得到第二过渡样本;将所述第二过渡样本输入所述变形层,得到第三过渡样本;将所述第三过渡样本输入所述二维卷积神经子网络,得到神经网络输出;基于所述第二过渡样本和所述一维图像数据间的差异、所述神经网络输出和所述该结构化数据样本间的差异,对所述全连接层和所述二维卷积神经子网络进行训练,得到所述卷积神经网络模型。进一步的,所述卷积神经子网络为二维卷积神经网络模型;所述卷积神经网络模型中还包括变形层;所述卷积神经网络模型的训练方式,包括:获取结构化数据样本集,所述结构化数据样本集中包含多个结构化数据样本;建立与所述结构化数据样本对应的二维图像数据,并将所述二维图像数据展开为一维图像数据;基于所述结构化数据样本集及所述一维图像数据,通过均方差损失函数进行参数调整,训练所述全连接层;将所述结构化数据样本集中的各结构化数据样本分别输入训练后的全连接层,得到第二过渡数据样本集;将所述第二过渡数据样本集中的样本分别输入所述变形层,得到第三过渡样本集;基于所述第三过渡数据样本集,训练所述二维卷积神经子网络;基于所述结构化数据样本集及所述一维图像数据,对由训练后的全连接层及训练后的二维卷积神经子网络组成的第二过渡网络模型进行训练,得到卷积神经网络模型。进一步的,所述卷积神经网络模型中包括第一子网络模型、第二子网络模型、第三子网络模型和第四子网络模型;其中,所述第一子网络模型和所述第二子网络模型的模型均包括:全连接层、一维卷积神经子网络;所述第三子网络模型和所述第四子网络模型的模型均包括:全连接层、变形层、二维卷积神经子网络;所述将所述待分类结构化数据输入预先训练得到的卷积神经网络模型,得到所述结构化数据的分类结果,包括:将所述待分类结构化数据输入所述第一子网络模型,经所述第一子网络模型中的全连接层的运算,得到具有局部特征的第一一维向量数据;将所述第一一维向量数据输入所述第一子网络模型中的一维卷积神经子网络,得到所述结构化数据针对各数据类型的第一置信度;将所述待分类结构化数据输入所述第二子网络模型,经所述第二子网络模型中的全连接层的运算,得到具有局部特征的第二一维向量数据;将所述第二一维向量数据输入所述第二子网络模型中的一维卷积神经子网络,得到所述结构化数据针对各数据类型的第二置信度;将所述待分类结构化数据输入所述第三子网络模型,经所述第三子网络模型中的全连接层的运算,得到具有局部特征的第三一维向量数据;将所述第三一维向量数据输入所述第三子网络模型中的变形层,得到第一二维图像数据;将所述第一二维图像数据输入所述第三子网络模型中的二维卷积神经子网络,得到所述结构化数据针对各数据类型的第三置信度;将所述待分类结构化数据输入所述第四子网络模型,经所述第四子网络模型中的全连接层的运算,得到具有局部特征的第四一维向量数据;将所述第四一维向量数据输入所述第四子网络模型中的变形层,得到第二二维图像数据;将所述第二二维图像数据输入所述第四子网络模型中的二维卷积神经子网络,得到所述结构化数据针对各数据类型的第四置信度;根据所述第一置信度、所述第二置信度、所述第三置信度和所述第四置信度,计算所述待分类结构化数据针对各数据类型的综合置信度;根据所述综合置信度,得到所述待分类结构化数据的分类结果。进一步的,所述根据所述第一置信度、所述第二置信度、所述第三置信度和所述第四置信度,计算所述待分类结构化数据针对各数据类型的综合置信度,包括:根据所述第一置信度、所述第二置信度、所述第三置信度和所述第四本文档来自技高网...

【技术保护点】
1.一种结构化数据分类方法,其特征在于,包括:获取待分类结构化数据;将所述待分类结构化数据输入预先训练得到的卷积神经网络模型,得到所述待分类结构化数据的分类结果,其中,所述卷积神经网络模型包括全连接层及卷积神经子网络,所述全连接层为所述卷积神经网络模型中的第一层。

【技术特征摘要】
1.一种结构化数据分类方法,其特征在于,包括:获取待分类结构化数据;将所述待分类结构化数据输入预先训练得到的卷积神经网络模型,得到所述待分类结构化数据的分类结果,其中,所述卷积神经网络模型包括全连接层及卷积神经子网络,所述全连接层为所述卷积神经网络模型中的第一层。2.根据权利要求1所述的方法,其特征在于,所述卷积神经子网络为一维卷积神经子网络;所述卷积神经网络模型的训练方式,包括:获取结构化数据样本集,所述结构化数据样本集中包含多个结构化数据样本;针对每个结构化数据样本,进行如下操作:将该结构化数据样本输入所述全连接层,得到第一过渡样本;将所述第一过渡样本输入所述一维卷积神经子网络,得到神经网络输出;基于所述神经网络输出和所述该结构化数据样本间的差异,对所述全连接层和所述一维卷积神经子网络进行训练,得到所述卷积神经网络模型。3.根据权利要求1所述的方法,其特征在于,所述卷积神经子网络为一维卷积神经子网络;所述卷积神经网络模型的训练方式,包括:获取结构化数据样本集,所述结构化数据样本集中包含多个结构化数据样本;基于所述结构化数据样本集,通过softmax损失函数进行参数调整,训练所述全连接层;将所述结构化数据样本集中的各结构化数据样本分别输入训练后的全连接层,得到第一过渡数据样本集;基于所述第一过渡数据样本集,训练所述一维卷积神经子网络;基于所述结构化数据样本集,对由训练后的全连接层和训练后的一维卷积神经子网络组成的第一过渡网络模型进行训练,得到卷积神经网络模型。4.根据权利要求1所述的方法,其特征在于,所述卷积神经子网络为二维卷积神经子网络;所述卷积神经网络模型中还包括变形层;所述卷积神经网络模型的训练方式,包括:获取结构化数据样本集,所述结构化数据样本集中包含多个结构化数据样本;建立与所述结构化数据样本对应的二维图像数据,并将所述二维图像数据展开为一维图像数据;针对每个结构化数据样本,进行如下操作:将该结构化数据样本输入所述全连接层,得到第二过渡样本;将所述第二过渡样本输入所述变形层,得到第三过渡样本;将所述第三过渡样本输入所述二维卷积神经子网络,得到神经网络输出;基于所述第二过渡样本和所述一维图像数据间的差异、所述神经网络输出和所述该结构化数据样本间的差异,对所述全连接层和所述二维卷积神经子网络进行训练,得到所述卷积神经网络模型。5.根据权利要求1所述的方法,其特征在于,所述卷积神经子网络为二维卷积神经网络模型;所述卷积神经网络模型中还包括变形层;所述卷积神经网络模型的训练方式,包括:获取结构化数据样本集,所述结构化数据样本集中包含多个结构化数据样本;建立与所述结构化数据样本对应的二维图像数据,并将所述二维图像数据展开为一维图像数据;基于所述结构化数据样本集及所述一维图像数据,通过均方差损失函数进行参数调整,训练所述全连接层;将所述结构化数据样本集中的各结构化数据样本分别输入训练后的全连接层,得到第二过渡数据样本集;将所述第二过渡数据样本集中的样本分别输入所述变形层,得到第三过渡样本集;基于所述第三过渡数据样本集,训练所述二维卷积神经子网络;基于所述结构化数据样本集及所述一维图像数据,对由训练后的全连接层及训练后的二维卷积神经子网络组成的第二过渡网络模型进行训练,得到卷积神经网络模型。6.根据权利要求1所述的方法,其特征在于,所述卷积神经网络模型中包括第一子网络模型、第二子网络模型、第三子网络模型和第四子网络模型;其中,所述第一子网络模型和所述第二子网络模型的...

【专利技术属性】
技术研发人员:刘奎康桂霞张宁波侯蓓蓓
申请(专利权)人:北京邮电大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1