神经网络的构建方法和装置制造方法及图纸

技术编号：26343579 阅读：22 留言：0更新日期：2020-11-13 20:47

本申请提供一种神经网络的构建方法和装置，涉及人工智能领域。该方法包括：初始化搜索空间和多个构建块，所述搜索空间中包括多个操作符，该构建块则是由多个节点之间通过操作符连接得到的网络结构；在训练过程中，在至少一次训练轮次中，随机丢弃部分操作符，以及利用未被丢弃的操作符更新该多个构建块，之后利用更新后的多个构建块构建目标神经网络。该方法通过随机丢弃部分操作符，打破了操作符之间的关联性，克服了训练过程中存在的耦合问题，使得获得的目标神经网络的性能更好。

Construction method and device of neural network

全部详细技术资料下载

【技术实现步骤摘要】
神经网络的构建方法和装置
本申请涉及人工智能领域，并且更具体地，涉及一种神经网络的构建方法和装置。
技术介绍
随着人工智能(artificialintelligence，AI)技术的快速发展，神经网络(例如，深度神经网络)近年来在图像、视频以及语音等多种媒体信号的处理与分析中取得了很大的成就。一个性能优良的神经网络往往拥有精妙的网络结构，而这需要具有高超技能和丰富经验的人类专家花费大量精力进行构建。为了更好地构建神经网络，人们提出了通过神经网络架构搜索(neuralarchitecturesearch，NAS)的方法来搭建神经网络，通过自动化地搜索神经网络结构，从而得到性能优异的神经网络结构。可微分架构搜索(differentiablearchitecturesearch，DARTS)是非常常见的神经网络架构搜索方法，由于DARTS被形式化为了一种二阶优化问题，所以有很多研究工作就指出，DARTS在搜索过程中是不稳定的，且难以收敛，经常会引导至搜索出较差的架构，而且二阶优化的计算开销相较于一阶优化更大，数据利用率也更低。为了缓解DARTS中的不稳定性问题，后来有相关技术如随机神经网络架构搜索(stochasticNAS，SNAS)、StacNAS等一阶优化的搜索方法。在现有技术中还有很多采用一阶优化的DARTS相较于二阶优化方法有着诸多优势之处，例如实现起来更容易，优化时收敛得更快，内存和数据利用率更高等。但是，在实际使用中却发现，当直接将一阶优化方法应用于原始的DARTS的搜索空间中时，搜索得到的架构的性能...

【技术保护点】
1.一种神经网络的构建方法，其特征在于，包括：/n初始化搜索空间和多个构建块，所述搜索空间中包括多个操作符，所述构建块是由多个节点之间通过所述操作符连接得到的网络结构；/n在至少一次训练轮次中，随机丢弃所述多个操作符中的部分操作符，利用未被丢弃的所述操作符更新所述多个构建块；/n利用更新后的所述多个构建块构建目标神经网络。/n

【技术特征摘要】
1.一种神经网络的构建方法，其特征在于，包括：
初始化搜索空间和多个构建块，所述搜索空间中包括多个操作符，所述构建块是由多个节点之间通过所述操作符连接得到的网络结构；
在至少一次训练轮次中，随机丢弃所述多个操作符中的部分操作符，利用未被丢弃的所述操作符更新所述多个构建块；
利用更新后的所述多个构建块构建目标神经网络。

2.如权利要求1所述的方法，其特征在于，所述利用更新后的所述多个构建块构建目标神经网络，包括：
利用最后一次的训练轮次中获得的所述更新后的多个构建块构建所述目标神经网络。

3.如权利要求1或2所述的方法，其特征在于，所述随机丢弃所述多个操作符中的部分操作符，包括：
根据所述多个操作符的种类，将所述多个操作符划分到多个操作符组；
在随机丢弃时，所述多个操作符组中的每个操作符组均保留至少一个操作符。

4.如权利要求3所述的方法，其特征在于，所述多个操作符组具有不完全相同的丢弃率，所述丢弃率用于表示所述多个操作符组中的每种操作符被丢弃的概率。

5.如权利要求3或4所述的方法，其特征在于，所述多个操作符组是根据所述多个操作符中每种操作符所包含的参数数量确定的。

6.如权利要求3至5中任一项所述的方法，其特征在于，所述多个操作符组包括第一操作符组和第二操作符组，所述第一操作符组中的操作符均不包含参数，所述第二操作符组中的操作符均包含参数。

7.如权利要求1至6中任一项所述的方法，其特征在于，所述利用未被丢弃的所述操作符更新所述多个构建块，包括：
在更新所述多个构建块时，只对所述未被丢弃的操作符所包含的参数进行权重衰减。

8.如权利要求1至7中任一项所述的方法，其特征在于，所述方法还包括：
根据被丢弃的所述操作符和所述未被丢弃的操作符的关系，调整所述更新后的多个构建块的架构参数。

9.如权利要求1至8中任一项所述的方法，其特征在于，所述操作符包括以下至少一种：跳连接、平均池化、最大池化、可分离卷积、扩大可分离卷积、置零操作。

10.如权利要求1至9中任一项所述的方法，其特征在于，所述方法还包括：
获取图像分类训练样本；
利用所述图像分类训练样本对所述目标神经网络进行训练，获得图像分类模型，所述图像分类模型用于对图像进行分类。

11.如权利要求1至9中任一项所述的方法，其特征在于，所述方法还包括：
获取目标检测训练样本；
利用所述目标检测训练样本对所述目标神经网络进行训练，获得目标检测模型，所述目标检测模型用于从待处理图像中检测出目标。

12.如权利要求11所述的方法，其特征在于，所述目标包括以下至少一种：车辆、行人、障碍物、道路标识、交通标识。

13.一种神经网络的构建装置，其特征在于，包括：
初始化单元，用于初始化搜索空间和多个构建块，所述搜索空间中包括多个操作符，所述构建块是由多个节点之间通过所述操作符连接得到的网络结构；

【专利技术属性】
技术研发人员：洪伟峻，李桂林，张伟楠，俞勇，张星，李震国，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人