神经网络模型建立方法、装置及计算机可读存储介质制造方法及图纸

技术编号：24800584 阅读：50 留言：0更新日期：2020-07-07 21:13

本发明专利技术提供一种神经网络模型建立方法、装置及计算机可读存储介质，方法包括：在数据输入层的下一层设置特征提取层，所述特征提取层用于对输入的待识别图像进行特征提取；将一个1*h的卷积核与一个h*1的卷积核相结合作为膨胀层的核心部分，其中，h为正奇数，将所述膨胀层与压榨层串联作为Fire块；建立各相邻Fire块之间的关联关系，获得调整后的待训练模型；通过预设的待训练数据对所述待训练模型进行训练，获得训练后的神经网络模型。该神经网络模型能够在保证识别精度的基础上，降低模型的内存大小，因此其能够方便自由存储嵌入存储介质中。

全部详细技术资料下载

【技术实现步骤摘要】
神经网络模型建立方法、装置及计算机可读存储介质
本专利技术涉及数据处理领域，尤其涉及一种神经网络模型建立方法、装置及计算机可读存储介质。
技术介绍
随着大数据时代的到来以及计算机硬件的不断更新迭代，图像识别的算法得到突飞猛进的发展。图像识别广泛应用到手写汉字识别、人脸识别、指纹识别、人工机器人等领域。图像识别有很多算法，主要包括传统的机器学习算法和深度学习。深度学习也叫做深层卷积神经网络学习，除了人工修正训练文件的一些配置参数外，网络中的所有参数都是通过训练数据并从数据中学习所得。而且卷积神经网络由于自身拥有局部感知域、权值共享、池化防过拟合等优点，所以在训练过程中能提取图像的深层抽象特征进行学习，并且整个训练过程无需人为干涉，最终的训练模型除了鲁棒性很强外，识别精度非常高。因此，目前人工智能企业都专注于将深度学习训练的网络模型应用到图像识别领域。常见的卷积神经网络模型有ResNet网络，其实目前公认识别精度最高的卷积神经网络。此外，SqueezeNet网络也是一种常见的卷积神经网络模型，其实目前公认的轻量级卷积神经...

【技术保护点】
1.一种神经网络模型建立方法，其特征在于，包括：/n在数据输入层的下一层设置特征提取层，所述特征提取层用于对输入的待识别图像进行特征提取；/n将一个1*h的卷积核与一个h*1的卷积核相结合作为膨胀层的核心部分，其中，h为正奇数，将所述膨胀层与压榨层串联作为Fire块；/n建立各相邻Fire块之间的关联关系，获得调整后的待训练模型；/n通过预设的待训练数据对所述待训练模型进行训练，获得训练后的神经网络模型。/n

【技术特征摘要】
1.一种神经网络模型建立方法，其特征在于，包括：
在数据输入层的下一层设置特征提取层，所述特征提取层用于对输入的待识别图像进行特征提取；
将一个1*h的卷积核与一个h*1的卷积核相结合作为膨胀层的核心部分，其中，h为正奇数，将所述膨胀层与压榨层串联作为Fire块；
建立各相邻Fire块之间的关联关系，获得调整后的待训练模型；
通过预设的待训练数据对所述待训练模型进行训练，获得训练后的神经网络模型。

2.根据权利要求1所述的方法，其特征在于，所述在数据输入层的下一层设置特征提取层，包括：
在数据输入层的下一层设置小波框架，将所述小波框架作为所述特征提取层。

3.根据权利要求1所述的方法，其特征在于，所述将一个1*h的卷积核与一个h*1的卷积核相结合作为膨胀层的核心部分，包括：
分别为所述1*h的卷积核以及h*1的卷积核设置延拓参数和步长参数，通过设置延拓参数和步长参数后的一个1*h的卷积核与一个h*1的卷积核相结合作为膨胀层的核心部分。

4.根据权利要求1所述的方法，其特征在于，所建立各相邻Fire块之间的关联关系，包括：
利用残差原理建立相邻Fire块之间的关联关系。

5.根据权利要求1所述的方法，其特征在于，所述通过预设的待训练数据对所述待训练模型进行训练，获得训练后的神经网络模型，包括：
将所述待训练数据随机分为训练集与测试集；
通过预设的数据扩充方式对所述训练集与测试集中的数据量进行扩充；
分别对所述训练集与测试集中的数据进行标注；
将所述训练集与测试集中的数据转换为统一尺度；
通过所述训练集中的数据对所述待训练模...

【专利技术属性】
技术研发人员：程立双，
申请(专利权)人：北大方正集团有限公司，北京北大方正电子有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人