一种神经网络模型的构建方法、设备以及存储介质技术

技术编号：20844194 阅读：18 留言：0更新日期：2019-04-13 08:54

本发明专利技术公开了一种实现图像的分类的神经网络模型的构建方法，包括步骤：S1，构建单元结构搜索网络、体系结构搜索网络、图像训练集以及随机编码数组；S2，利用单元结构搜索网络、体系结构搜索网络以及随机编码数组生成神经网络模型；S3，将图像训练集输入神经网络模型得到实际分类结果；S4，判断实际分类结果是否满足预设条件，若不满足，则进行步骤S5；S5，根据实际分类结果以及图像训练集的理论分类更新单元结构搜索网络以及体系结构搜索网络；S6，重复S2‑S5，直到在S4得出实际分类结果满足预设条件的判断。本发明专利技术公开的方法将原搜索空间转换为单元结构搜索和体系结构搜索两个空间，通过自动学习方式搜索体系最佳结构，增强生成的模型架构的灵活性。

全部详细技术资料下载

【技术实现步骤摘要】
一种神经网络模型的构建方法、设备以及存储介质
本专利技术涉及图像分类领域，更具体地，特别是指一种神经网络模型的构建方法、设备以及可读存储介质。
技术介绍
神经网络模型是一种可任意堆砌的模型结构，基础的组件包括FC(全连接层)、Convolution(卷积层)、Polling(池化层)、Activation(激活函数)等，后一个组件以前一个组件的输出作为输入，不同的组件连接方式和超参配置方式在不同应用场景有不同的效果。神经架构搜索(NeuralArchitectureSearch，NAS)，目标是从一堆神经网络组件中，搜索到一个最优的神经网络模型。其中，常见的搜索方法包括随机搜索、贝叶斯优化、进化算法、强化学习、基于梯度的算法等。Zoph等人在2016年提出采用RNN去搜索一个最好的网络结构，但因搜索空间太大，耗时22,400GPU工作天数，于2017年改成采用强化学习搜索CNN的效果最好的卷积单元(convcell)，再用这些convcell来构建一个更好的网络，但是该算法在CIFAR-10和ImageNet上获得当前最佳架构仍需要2000个GPU工作天数。人们已经提出了很多加速方法，例如提出多个架构之间共享权重，以及基于连续搜索空间的梯度下降的可微架构搜索。但这些算法都采用手工设定网络体系结构的方法，导致体系架构的灵活性存在挑战。由此可见，当前神经架构搜索算存在如下问题：(1)由于组合的方式太多，所以搜索空间巨大，函数计算代价巨大；(2)手工设计模型体系结构，缺乏灵活性。
技术实现思路
有鉴于此，为了克服上述问题的至少一个方面，本专利技术实施例的提出一种用于...

【技术保护点】
1.一种神经网络模型的构建方法，所述神经网络模型用于实现图像的分类，所述方法包括步骤：S1，构建单元结构搜索网络、体系结构搜索网络、图像训练集以及随机编码数组；S2，利用单元结构搜索网络、体系结构搜索网络以及随机编码数组生成所述神经网络模型；S3，将所述图像训练集输入所述神经网络模型以得到实际分类结果；S4，根据所述图像训练集的理论分类来判断所述实际分类结果是否满足预设条件，若不满足，则进行步骤S5；S5，根据所述实际分类结果以及所述理论分类来更新所述单元结构搜索网络以及所述体系结构搜索网络；S6，重复步骤S2‑S5，直到在S4得出实际分类结果满足预设条件的判断。

【技术特征摘要】
1.一种神经网络模型的构建方法，所述神经网络模型用于实现图像的分类，所述方法包括步骤：S1，构建单元结构搜索网络、体系结构搜索网络、图像训练集以及随机编码数组；S2，利用单元结构搜索网络、体系结构搜索网络以及随机编码数组生成所述神经网络模型；S3，将所述图像训练集输入所述神经网络模型以得到实际分类结果；S4，根据所述图像训练集的理论分类来判断所述实际分类结果是否满足预设条件，若不满足，则进行步骤S5；S5，根据所述实际分类结果以及所述理论分类来更新所述单元结构搜索网络以及所述体系结构搜索网络；S6，重复步骤S2-S5，直到在S4得出实际分类结果满足预设条件的判断。2.如权利要求1所述的方法，其特征在于，得出满足预设条件的实际分类结果的神经网络模型为最优的神经网络模型。3.如权利要求1所述的方法，其特征在于，所述步骤S2进一步包括：S21，利用所述单元结构搜索网络和所述体系结构搜索网络对所述随机编码数组进行搜索，得到单元结构编码数组和体系结构编码数组；以及S22，利用解码器对所述单元结构编码数组和所述体系结构编码数组进行解码，得到所述神经网络模型。4.如权利要求3所述的方法，其特征在于，所述单元结构编码数组包括下降单元数组和正常单...

【专利技术属性】
技术研发人员：刘红丽，李峰，刘宏刚，
申请(专利权)人：郑州云海信息技术有限公司，
类型：发明
国别省市：河南,41

全部详细技术资料下载我是这个专利的主人