神经网络搜索方法、装置、电子设备和存储介质制造方法及图纸

技术编号：37182769 阅读：22 留言：0更新日期：2023-04-20 22:48

本公开提供了一种神经网络搜索方法、装置、电子设备和存储介质，通过基于第一搜索空间构建超网，其中，第一搜索空间包括深度可分离卷积模块，深度可分离卷积模块包括不同卷积核尺寸的多个第一卷积分支，且多个第一卷积分支分别级联第一批归一化层，各第一批归一化层的输出合并连接至下一操作层；基于训练样本对超网进行迭代训练，直至超网满足收敛条件；使得搜索空间能够对相同张量进行不同感受野大小的特征提取，从训练完备的超网中搜索满足部署条件的目标子网，从而解决了相关技术的搜索空间只能进行固定感受野大小的特征提取的问题，提升了模型的性能。提升了模型的性能。提升了模型的性能。

全部详细技术资料下载

【技术实现步骤摘要】
神经网络搜索方法、装置、电子设备和存储介质

[0001]本专利技术涉及人工智能
，尤其涉及一种神经网络搜索方法、装置、电子设备和存储介质。

技术介绍

[0002]神经结构搜索(Neural Architecture Search，NAS)，是一种基于权重共享的神经网络搜索方法，该搜索方法先通过特定的搜索空间构建超网，再对超网进行训练。当超网训练完备后，搜索满足部署条件的目标子网，最后将搜索得到的目标子网部署到生产环境中。然而，相关技术的搜索空间只能进行固定感受野大小的特征提取，限制了模型的性能。

技术实现思路

[0003]鉴于此，本公开提供了一种神经网络搜索方法、装置、电子设备和存储介质，以使得搜索空间能够对相同张量进行不同感受野大小的特征提取。
[0004]根据本公开的一方面，提供了一种神经网络搜索方法，包括：基于第一搜索空间构建超网，其中，所述第一搜索空间包括深度可分离卷积模块，所述深度可分离卷积模块包括不同卷积核尺寸的多个第一卷积分支，且所述多个第一卷积分支分别级联第一批归一化层，各所述第一批归一化层的输出合并连接至下一操作层；基于训练样本对所述超网进行迭代训练，直至所述超网满足收敛条件；从训练完备的超网中搜索满足部署条件的目标子网。
[0005]一种可选的实施方式中，基于第一搜索空间构建超网，包括：将所述多个第一卷积分支分别与级联的第一批归一化层进行合并，得到多个第二卷积分支，并将所述多个第二卷积分支进行合并，得到第三卷积分支。
[0006]一种可选的实施方式中，...

【技术保护点】

【技术特征摘要】
1.一种神经网络搜索方法，其特征在于，包括：基于第一搜索空间构建超网，其中，所述第一搜索空间包括深度可分离卷积模块，所述深度可分离卷积模块包括不同卷积核尺寸的多个第一卷积分支，且所述多个第一卷积分支分别级联第一批归一化层，各所述第一批归一化层的输出合并连接至下一操作层；基于训练样本对所述超网进行迭代训练，直至所述超网满足收敛条件；从训练完备的超网中搜索满足部署条件的目标子网。2.如权利要求1所述的神经网络搜索方法，其特征在于，基于第一搜索空间构建超网，包括：将所述多个第一卷积分支分别与级联的第一批归一化层进行合并，得到多个第二卷积分支，并将所述多个第二卷积分支进行合并，得到第三卷积分支。3.如权利要求2所述的神经网络搜索方法，其特征在于，将所述多个第二卷积分支进行合并，得到第三卷积分支，包括：将各所述第二卷积分支的卷积核矩阵进行边界填充，使得所述多个第二卷积分支的卷积核尺寸保持一致；将经过边界填充后的所述多个第二卷积分支的卷积核矩阵相加，得到所述第三卷积分支。4.如权利要求1至3中任一项所述的神经网络搜索方法，其特征在于，所述多个第一卷积分支包括以下至少两种卷积核尺寸：1，3，5，7。5.如权利要求1至3中任一项所述的神经网络搜索方法，其特征在于，所述第一搜索空间还包括：第一特征提取单元和第二特征提取单元，所述第一特征提取单元、所述深度可分离卷积模块、所述第二特征提取单元依次连接；其中，所述第一特征提取单元包括依次连接的第一卷积层、第二批归一化层和第一激活层；所述第二特征提取单元包括依次连接的第二激活层和注意力模块。6.如权利要求5所述的神经网络搜索方法，其特征在于，所述第一搜索空间还包括：携带有批归一化操作的跳跃连接层，所述跳跃连接层与所述深度可分离卷积模块并列设置于所述第一特征提取单元和所述第二特征提...

【专利技术属性】
技术研发人员：张凯昱，杨青，
申请(专利权)人：度小满科技北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人