The present disclosure provides a method for creating a neural network, a device for creating a neural network, an image processing method for processing input images using a neural network, an electronic device and a computer readable storage medium. The method for creating the neural network includes: configuring a plurality of initial network units, each of which includes at least a plurality of network sub-units with the same input and output terminals, and weighted gating units connected with said output terminals of the plurality of network sub-units; configuring an initial neural network, which comprises at least the plurality of said initial neural networks. Initial network unit; training the initial neural network based on the objective task of the neural network until a predetermined training end condition is satisfied; and for each of the multiple initial network units, a network subunit is selected by the weighted gating unit, and other network subunits and the weighted gating unit are removed to obtain the created neural network. \u3002
【技术实现步骤摘要】
神经网络创建方法和装置、图像处理方法和电子设备
本公开涉及图像处理领域,更具体地,本公开涉及一种神经网络创建方法、创建装置、使用神经网络处理输入图像的图像处理方法、电子设备以及计算机可读存储介质。
技术介绍
神经网络是一种大规模、多参数优化的工具。依靠大量的训练数据,神经网络能够学习出数据中难以总结的隐藏特征,从而完成多项复杂的任务,如人脸检测、图像语义分割、物体检测、动作追踪、自然语言翻译等。神经网络已被人工智能界广泛应用。当前,神经网络模型设计主要由诸如每秒数十亿次浮点运算(FLOPs)的计算复杂度的间接度量指导。然而,例如处理速度这样的直接度量还取决于其他因素,诸如存储器访问成本和平台特性等。也就是说,在进行神经网络创建时,除了考虑FLOPs外,还需要评估关于目标平台的直接度量。通过对影响神经网络模型实际执行速度的原因进行理论分析和实验验证,可以提出高效率神经网络的设计原则。因此,需要能够根据高效率神经网络的设计原则,创建适合不同平台和使用场景的神经网络。
技术实现思路
鉴于上述问题而提出了本公开。本公开提供了一种神经网络创建方法、创建装置、使用神经网络处理输入图像的图像处理方法、电子设备以及计算机可读存储介质。根据本公开的一个方面,提供了一种神经网络创建方法,包括:配置多个初始网络单元,所述多个初始网络单元的每个至少包括具有相同的输入端和输出端的多个网络子单元,以及与所述多个网络子单元的所述输出端连接的加权选通单元;配置初始神经网络,所述初始神经网络至少包括所述多个初始网络单元;基于所述神经网络的目标任务,训练所述初始神经网络,直到满足预定训练结束条件 ...
【技术保护点】
1.一种神经网络创建方法,包括:配置多个初始网络单元,所述多个初始网络单元的每个至少包括具有相同的输入端和输出端的多个网络子单元,以及与所述多个网络子单元的所述输出端连接的加权选通单元;配置初始神经网络,所述初始神经网络至少包括所述多个初始网络单元;基于所述神经网络的目标任务,训练所述初始神经网络,直到满足预定训练结束条件;以及对于所述多个初始网络单元中的每一个,通过所述加权选通单元选择一个网络子单元,并且移除其他网络子单元和所述加权选通单元,以获得创建的神经网络。
【技术特征摘要】
1.一种神经网络创建方法,包括:配置多个初始网络单元,所述多个初始网络单元的每个至少包括具有相同的输入端和输出端的多个网络子单元,以及与所述多个网络子单元的所述输出端连接的加权选通单元;配置初始神经网络,所述初始神经网络至少包括所述多个初始网络单元;基于所述神经网络的目标任务,训练所述初始神经网络,直到满足预定训练结束条件;以及对于所述多个初始网络单元中的每一个,通过所述加权选通单元选择一个网络子单元,并且移除其他网络子单元和所述加权选通单元,以获得创建的神经网络。2.如权利要求1所述的神经网络创建方法,其中,所述加权选通单元为所述多个网络子单元中的每一个提供对应的加权选通系数,其中,所述训练所述初始神经网络包括:调整所述加权选通系数,其中,所述通过所述加权选通单元选择一个网络子单元包括:保留其中所述对应的加权选通系数最大的一个网络子单元。3.如权利要求1或2所述的神经网络创建方法,其中,所述一个网络子单元满足以下一个或多个条件:所述一个网络子单元的输入和输出通道数差异小于预设阈值;所述一个网络子单元执行深度可分离卷积;所述一个网络子单元执行池化;所述一个网络子单元执行神经元激活。4.如权利要求1或2所述的神经网络创建方法,其中,所述神经网络为第二代通道重排网络,所述一个网络子单元满足第二代通道重排网络的预设规则。5.如权利要求2所述的神经网络创建方法,其中,所述通过所述加权选通单元选择一个网络子单元表示为:其中,Bi表示所述多个网络子单元中每一个网络子单元的输出值,di表示所述每一个网络子单元的加权选通系数,T表示温度参数,i是1到n之间的自然数,n是所述多个网络子单元的个数,其中,所述训练所述初始神经网络还包括:随着训练逐步增大T。6.一种神经网络创建装置,包括:配置模块,用于配置多个初始网络单元,所述多个初始网络单元的每个至少包括具有相同的输入端和输出端的多个网络子单元,以及与所述多个网络子单元的所述输出端连接的加权选通单元;配置初始神经网络,所述初始神经网络至少包括所述多个初始网络单元;训练模块,用于基于所述神经网络的目标任务,训练所述初始神经网络,直到满足预定训练结束...
【专利技术属性】
技术研发人员:张祥雨,
申请(专利权)人:北京迈格威科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。