神经网络创建方法和装置、图像处理方法和电子设备制造方法及图纸

技术编号:20918662 阅读:13 留言:0更新日期:2019-04-20 10:08
本公开提供一种神经网络创建方法、创建装置、使用神经网络处理输入图像的图像处理方法、电子设备以及计算机可读存储介质。所述神经网络创建方法,包括:配置多个初始网络单元,所述多个初始网络单元的每个至少包括具有相同的输入端和输出端的多个网络子单元,以及与所述多个网络子单元的所述输出端连接的加权选通单元;配置初始神经网络,所述初始神经网络至少包括所述多个初始网络单元;基于所述神经网络的目标任务,训练所述初始神经网络,直到满足预定训练结束条件;以及对于所述多个初始网络单元中的每一个,通过所述加权选通单元选择一个网络子单元,并且移除其他网络子单元和所述加权选通单元,以获得创建的神经网络。

Neural Network Creation Method and Device, Image Processing Method and Electronic Equipment

The present disclosure provides a method for creating a neural network, a device for creating a neural network, an image processing method for processing input images using a neural network, an electronic device and a computer readable storage medium. The method for creating the neural network includes: configuring a plurality of initial network units, each of which includes at least a plurality of network sub-units with the same input and output terminals, and weighted gating units connected with said output terminals of the plurality of network sub-units; configuring an initial neural network, which comprises at least the plurality of said initial neural networks. Initial network unit; training the initial neural network based on the objective task of the neural network until a predetermined training end condition is satisfied; and for each of the multiple initial network units, a network subunit is selected by the weighted gating unit, and other network subunits and the weighted gating unit are removed to obtain the created neural network. \u3002

【技术实现步骤摘要】
神经网络创建方法和装置、图像处理方法和电子设备
本公开涉及图像处理领域,更具体地,本公开涉及一种神经网络创建方法、创建装置、使用神经网络处理输入图像的图像处理方法、电子设备以及计算机可读存储介质。
技术介绍
神经网络是一种大规模、多参数优化的工具。依靠大量的训练数据,神经网络能够学习出数据中难以总结的隐藏特征,从而完成多项复杂的任务,如人脸检测、图像语义分割、物体检测、动作追踪、自然语言翻译等。神经网络已被人工智能界广泛应用。当前,神经网络模型设计主要由诸如每秒数十亿次浮点运算(FLOPs)的计算复杂度的间接度量指导。然而,例如处理速度这样的直接度量还取决于其他因素,诸如存储器访问成本和平台特性等。也就是说,在进行神经网络创建时,除了考虑FLOPs外,还需要评估关于目标平台的直接度量。通过对影响神经网络模型实际执行速度的原因进行理论分析和实验验证,可以提出高效率神经网络的设计原则。因此,需要能够根据高效率神经网络的设计原则,创建适合不同平台和使用场景的神经网络。
技术实现思路
鉴于上述问题而提出了本公开。本公开提供了一种神经网络创建方法、创建装置、使用神经网络处理输入图像的图像处理方法、电子设备以及计算机可读存储介质。根据本公开的一个方面,提供了一种神经网络创建方法,包括:配置多个初始网络单元,所述多个初始网络单元的每个至少包括具有相同的输入端和输出端的多个网络子单元,以及与所述多个网络子单元的所述输出端连接的加权选通单元;配置初始神经网络,所述初始神经网络至少包括所述多个初始网络单元;基于所述神经网络的目标任务,训练所述初始神经网络,直到满足预定训练结束条件;以及对于所述多个初始网络单元中的每一个,通过所述加权选通单元选择一个网络子单元,并且移除其他网络子单元和所述加权选通单元,以获得创建的神经网络。根据本公开的另一个方面,提供了一种神经网络创建装置,包括:配置模块,用于配置多个初始网络单元,所述多个初始网络单元的每个至少包括具有相同的输入端和输出端的多个网络子单元,以及与所述多个网络子单元的所述输出端连接的加权选通单元;配置初始神经网络,所述初始神经网络至少包括所述多个初始网络单元;训练模块,用于基于所述神经网络的目标任务,训练所述初始神经网络,直到满足预定训练结束条件;以及创建模块,用于对于所述多个初始网络单元中的每一个,通过所述加权选通单元选择一个网络子单元,并且移除其他网络子单元和所述加权选通单元,以获得创建的神经网络。根据本公开的又一个方面,提供了一种使用神经网络处理输入图像的图像处理方法,所述神经网络包含输入层、中间层和输出层,所述图像处理方法包括:创建所述神经网络;经由所述输入层接收所述输入图像;经由所述中间层提取所述输入图像的图像特征;以及经由所述输出层输出对于所述输入图像的处理结果,其中,创建所述神经网络包括:使用如上所述的神经网络创建方法,以创建所述神经网络。根据本公开的再一个方面,提供了一种电子设备,包括:存储器,用于存储计算机可读指令;以及处理器,用于运行所述计算机可读指令,执行如上所述神经网络创建方法或图像处理方法。根据本公开的再一个方面,提供了一种计算机可读存储介质,用于存储计算机可读指令,当所述计算机可读指令由计算机执行时,使得所述计算机执行如上所述神经网络创建方法或图像处理方法。如下将详细描述的,根据本公开的实施例的神经网络创建方法在高效率神经网络的总体设计原则下,充分利用目标任务数据,自动挑选适合该目标任务数据并且符合的高效率神经网络的总体设计原则的神经网络模型结构。因此,根据本公开的实施例的神经网络创建方法避免了手工设计模型的局限性,同时还具备了执行的高效性。要理解的是,前面的一般描述和下面的详细描述两者都是示例性的,并且意图在于提供要求保护的技术的进一步说明。附图说明通过结合附图对本专利技术实施例进行更详细的描述,本专利技术的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本专利技术实施例的进一步理解,并且构成说明书的一部分,与本专利技术实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中,相同的参考标号通常代表相同部件或步骤。图1是图示根据本公开的实施例的神经网络创建方法的流程图;图2是图示根据本公开的实施例的初始神经网络的示意图;图3A是图示使用根据本公开的实施例的神经网络创建方法的初始网络单元的一个示意图;图3B是图示使用根据本公开的实施例的神经网络创建方法创建的网络单元的一个示意图;图4A是图示使用根据本公开的实施例的神经网络创建方法的初始网络单元的另一个示意图;图4B是图示使用根据本公开的实施例的神经网络创建方法创建的网络单元的另一个示意图;图5是图示根据本公开的实施例的图像处理方法的流程图;图6是图示根据本公开的实施例的图像处理方法的示意图;图7是图示根据本公开的实施例的神经网络创建装置的框图;图8是图示根据本公开的实施例的电子设备的硬件框图;以及图9是图示根据本公开的实施例的计算机可读存储介质的示意图。具体实施方式为了使得本公开的目的、技术方案和优点更为明显,下面将参照附图详细描述根据本公开的示例实施例。显然,所描述的实施例仅仅是本公开的一部分实施例,而不是本公开的全部实施例,应理解,本公开不受这里描述的示例实施例的限制。首先,参照图1到图4B描述根据本公开的实施例的神经网络创建方法。图1是图示根据本公开的实施例的神经网络创建方法的流程图。如图1所示,根据本公开的实施例的神经网络创建方法包括以下步骤。在步骤S101中,配置多个初始网络单元。在步骤S102中,配置至少包括多个初始网络单元的初始神经网络。以下,具体参照图2和图3A描述根据本公开的实施例的初始神经网络。图2是图示根据本公开的实施例的初始神经网络的示意图。如图2所示,初始神经网络至少包括多个初始网络单元MB1、MB2…MBn,并且多个初始网络单元MB1、MB2…MBn顺序连接。需要注意的是,图2所示的初始神经网络仅仅是示意性的,根据本公开的实施例的初始神经网络不限于此,而是可以根据具体任务需求包括任意数量的其他单元,例如包括其他卷积、池化、全连接等网络单元穿插连接在多个初始网络单元之间,以构成完整的训练网络。图3A是图示使用根据本公开的实施例的神经网络创建方法的初始网络单元的一个示意图。如图3A所示,多个初始网络单元MB1、MB2…MBm的每个MB至少包括具有相同的输入端301和输出端302的多个网络子单元B1、B2…Bn,以及与所述多个网络子单元B1、B2…Bn的所述输出端302连接的加权选通单元303。所述加权选通单元302为所述多个网络子单元B1、B2…Bn中的每一个提供对应的加权选通系数。返回参照图1,在步骤S101和S102中配置了初始神经网络以及其中的多个初始网络单元之后,在步骤S103中,基于所述神经网络的目标任务,训练所述初始神经网络,直到满足预定训练结束条件。在本公开的一个实施例中,训练所述初始神经网络包括调整所述加权选通单元302为所述多个网络子单元B1、B2…Bn中的每一个提供对应的加权选通系数。需要理解的是,训练所述初始神经网络还包括其他卷积、池化、全连接单元以及多个网络子单元B1、B2…Bn自身的所有参数。在本公开的一个实施例中,预定训练结束条件取决于目本文档来自技高网...

【技术保护点】
1.一种神经网络创建方法,包括:配置多个初始网络单元,所述多个初始网络单元的每个至少包括具有相同的输入端和输出端的多个网络子单元,以及与所述多个网络子单元的所述输出端连接的加权选通单元;配置初始神经网络,所述初始神经网络至少包括所述多个初始网络单元;基于所述神经网络的目标任务,训练所述初始神经网络,直到满足预定训练结束条件;以及对于所述多个初始网络单元中的每一个,通过所述加权选通单元选择一个网络子单元,并且移除其他网络子单元和所述加权选通单元,以获得创建的神经网络。

【技术特征摘要】
1.一种神经网络创建方法,包括:配置多个初始网络单元,所述多个初始网络单元的每个至少包括具有相同的输入端和输出端的多个网络子单元,以及与所述多个网络子单元的所述输出端连接的加权选通单元;配置初始神经网络,所述初始神经网络至少包括所述多个初始网络单元;基于所述神经网络的目标任务,训练所述初始神经网络,直到满足预定训练结束条件;以及对于所述多个初始网络单元中的每一个,通过所述加权选通单元选择一个网络子单元,并且移除其他网络子单元和所述加权选通单元,以获得创建的神经网络。2.如权利要求1所述的神经网络创建方法,其中,所述加权选通单元为所述多个网络子单元中的每一个提供对应的加权选通系数,其中,所述训练所述初始神经网络包括:调整所述加权选通系数,其中,所述通过所述加权选通单元选择一个网络子单元包括:保留其中所述对应的加权选通系数最大的一个网络子单元。3.如权利要求1或2所述的神经网络创建方法,其中,所述一个网络子单元满足以下一个或多个条件:所述一个网络子单元的输入和输出通道数差异小于预设阈值;所述一个网络子单元执行深度可分离卷积;所述一个网络子单元执行池化;所述一个网络子单元执行神经元激活。4.如权利要求1或2所述的神经网络创建方法,其中,所述神经网络为第二代通道重排网络,所述一个网络子单元满足第二代通道重排网络的预设规则。5.如权利要求2所述的神经网络创建方法,其中,所述通过所述加权选通单元选择一个网络子单元表示为:其中,Bi表示所述多个网络子单元中每一个网络子单元的输出值,di表示所述每一个网络子单元的加权选通系数,T表示温度参数,i是1到n之间的自然数,n是所述多个网络子单元的个数,其中,所述训练所述初始神经网络还包括:随着训练逐步增大T。6.一种神经网络创建装置,包括:配置模块,用于配置多个初始网络单元,所述多个初始网络单元的每个至少包括具有相同的输入端和输出端的多个网络子单元,以及与所述多个网络子单元的所述输出端连接的加权选通单元;配置初始神经网络,所述初始神经网络至少包括所述多个初始网络单元;训练模块,用于基于所述神经网络的目标任务,训练所述初始神经网络,直到满足预定训练结束...

【专利技术属性】
技术研发人员:张祥雨
申请(专利权)人:北京迈格威科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1