基于深度学习的图像分类方法、装置及计算机设备制造方法及图纸

技术编号：26260107 阅读：33 留言：0更新日期：2020-11-06 17:55

本申请公开了一种基于深度学习的图像分类方法、装置及计算机设备，涉及人工智能技术领域。其中方法包括：首先基于MobileNet网络，配置神经架构的搜索空间信息；再根据搜索空间信息构建超网，以及配置超网的每一卷积层对应的弹簧结构，其中，弹簧结构用于超网训练时将同一卷积层不同操作项对应的通道数都固定到相同的通道数上输出给下一卷积层；然后利用第一图片训练集对超网进行训练，以确定适合图像分类的目标神经架构；最后利用第二图片训练集对目标神经架构的模型进行训练，并使用训练达标的模型，对待分类图片进行图像分类。本申请可提高图像分类的精确性。此外，本申请还涉及区块链技术，模型训练数据可存储于区块链中，以保证数据私密和安全性。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习的图像分类方法、装置及计算机设备
本申请涉及人工智能
，尤其是涉及到一种基于深度学习的图像分类方法、装置及计算机设备。
技术介绍
图像分类可采用深度学习方法进行智能化的分类，其中深度学习方法在机器学习领域取得了很大的成功，涌现了许多经典的有效的网络结构。然而这些网络结构的设计依赖于领域专家们丰富的经验，并且需要花费大量的时间和精力进行设计和实验。因此，神经架构搜索方法成为了近几年的热门研究领域，通过定义搜索空间，采用强化学习、进化算法等方法自动搜索最优的网络结构。这些方法非常耗时且需要占用大量的GPU资源。因此为了解决上述问题，目前提出了采用权重共享的One-Shot方法，通过构建一个包含所有操作选项的有向无环图即超网，仅通过一次训练，在训练好的超网上采样由不同的操作项组成的单条路径构成的网络，评估在测试集上的准确率，进而挑选出最优的神经架构。然而，本专利技术创造的专利技术人在研究中发现，由于卷积神经网络中前一层的输出与后一层的输入在通道数上需要保持一致，而超网无法定义通道数维度上的搜索，而...

【技术保护点】
1.一种基于深度学习的图像分类方法，其特征在于，包括：/n基于MobileNet网络，配置神经架构的搜索空间信息；/n根据所述搜索空间信息构建超网，以及配置所述超网的每一卷积层对应的弹簧结构，其中，所述弹簧结构用于所述超网训练时将同一卷积层不同操作项对应的通道数都固定到相同的通道数上输出给下一卷积层；/n利用第一图片训练集对所述超网进行训练，以确定适合图像分类的目标神经架构；/n利用第二图片训练集对所述目标神经架构的模型进行训练，并使用训练达标的所述模型，对待分类图片进行图像分类。/n

【技术特征摘要】
1.一种基于深度学习的图像分类方法，其特征在于，包括：
基于MobileNet网络，配置神经架构的搜索空间信息；
根据所述搜索空间信息构建超网，以及配置所述超网的每一卷积层对应的弹簧结构，其中，所述弹簧结构用于所述超网训练时将同一卷积层不同操作项对应的通道数都固定到相同的通道数上输出给下一卷积层；
利用第一图片训练集对所述超网进行训练，以确定适合图像分类的目标神经架构；
利用第二图片训练集对所述目标神经架构的模型进行训练，并使用训练达标的所述模型，对待分类图片进行图像分类。

2.根据权利要求1所述的方法，其特征在于，所述弹簧结构是基于反向残差结构对所述超网的每一卷积层进行改造得到的，所述弹簧结构的中间深度卷积层用于深层特征提取，所述中间深度卷积层的前后各有1×1卷积层；
其中所述中间深度卷积层的前1×1卷积层用于扩大输入特征多样性，所述中间深度卷积层的后1×1卷积层用于将提取的深层特征恢复到固定的通道数上并输出给下一卷积层，所述固定的通道数为所属卷积层结构可选的最大通道数。

3.根据权利要求2所述的方法，其特征在于，所述利用第二图片训练集对所述目标神经架构的模型进行训练，具体包括：
在对所述目标神经架构的模型从头开始独立训练时，所有采用最大通道数输出的弹簧结构调整为当前每一卷积层选取的操作项原本的通道数大小，以便恢复成标准的反向残差结构；
利用第二图片训练集对恢复成标准的反向残差结构的所述目标神经架构的模型进行训练。

4.根据权利要求1所述的方法，其特征在于，所述利用第一图片训练集对所述超网进行训练，以确定适合图像分类的目标神经架构，具体包括：
将所述超网的训练过程按照预设时间间隔分为多个子训练过程；
每次执行子训练过程时，基于上一子训练过程得到的超网，随机采样超网的一条路径进行权重更新，并基于路径权重更新后的超网继续进行训练，以便收缩所述超网对应的搜索空间；
在收缩搜索空间后的所述超网中，搜索所述目标神经架构。

5.根据权利要求4所述的方法，其特征在于，所述每次执行子训练过程时，基于上一子训练过程得到的超网，随机采样超网的一条路径进行权重更新，并基于路径权重更新后的超网继续进行训练，以便收缩所述超网对应的搜索空间，具体包括：
随机从上一子训练过程训练得到的超网中采样预设个数的模型；
利用图片测试集，对采样的模型进行测试，所述图片测试集是根据所述第一图片训练集确定得到的；
按照测试准确率，将采...

【专利技术属性】
技术研发人员：沈赞，庄伯金，王少军，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人