卷积神经网络处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:24889929 阅读:985 留言:0更新日期:2020-07-14 18:16
本发明专利技术实施例提供了一种卷积神经网络处理方法、装置、电子设备及存储介质,所述方法包括:创建目标卷积神经网络,所述目标卷积神经网络的每一层的输入端与输出端之间设置有恒等变换分支和卷积处理分支,其中,所述恒等变换分支的输出与输入相同;为所述目标卷积神经网络的各个层中的恒等变换分支和卷积处理分支分别分配相应的权重,得到多个子卷积神经网络;以多个子卷积神经网络中至少部分子卷积神经网络为搜索空间,按照预设的模型搜索算法进行搜索,得到目标子卷积神经网络;根据目标子卷积神经网络的层数,确定预设的模型搜索算法的性能参数值。

【技术实现步骤摘要】
卷积神经网络处理方法、装置、电子设备及存储介质
本专利技术涉及深度学习
,特别是涉及一种卷积神经网络处理方法、装置、电子设备及存储介质。
技术介绍
近年来,随着深度学习技术的发展,卷积神经网络在各种视觉识别、语音识别任务中都取得了突破性的进展。例如,在语音识别任务中,向一个卷积神经网络中输入一段音频,经过卷积神经网络的输出,便可以识别出该段音频所属的用户的身份。其中,卷积神经网络的模型结构对于识别任务的完成精度有着重要的影响,合适的模型结构可以显著提高识别任务的精确度。一般可以通过人工设计卷积神经网络的模型结构,但是此种方式消耗的人力成本过大,误差也不可避免。相关技术中,提出了自动化模型结构设计的方案,以替代人工设计模型结构。具体是设计好一个具备一定深度的卷积神经网络作为搜索空间,利用搜索方法在该搜索空间中搜索出最佳的模型结构。因此,只需要设计搜索空间、搜索算法以及对模型结构的评价指标,便可以设计出合适的模型结构。但是,上述方式对于一个固定的搜索空间而言,其搜索出的模型结构的性能较差。在采用的搜索算法不同时本文档来自技高网...

【技术保护点】
1.一种卷积神经网络处理方法,其特征在于,包括:/n创建目标卷积神经网络,所述目标卷积神经网络的每一层的输入端与输出端之间设置有恒等变换分支和卷积处理分支,其中,所述恒等变换分支的输出与输入相同;/n为所述目标卷积神经网络的各个层中的恒等变换分支和卷积处理分支分别分配相应的权重,得到多个子卷积神经网络;/n以所述多个子卷积神经网络中至少部分子卷积神经网络为搜索空间,按照预设的模型搜索算法进行搜索,得到目标子卷积神经网络;/n根据所述目标子卷积神经网络的层数,确定所述预设的模型搜索算法的性能参数值。/n

【技术特征摘要】
1.一种卷积神经网络处理方法,其特征在于,包括:
创建目标卷积神经网络,所述目标卷积神经网络的每一层的输入端与输出端之间设置有恒等变换分支和卷积处理分支,其中,所述恒等变换分支的输出与输入相同;
为所述目标卷积神经网络的各个层中的恒等变换分支和卷积处理分支分别分配相应的权重,得到多个子卷积神经网络;
以所述多个子卷积神经网络中至少部分子卷积神经网络为搜索空间,按照预设的模型搜索算法进行搜索,得到目标子卷积神经网络;
根据所述目标子卷积神经网络的层数,确定所述预设的模型搜索算法的性能参数值。


2.根据权利要求1所述的方法,其特征在于,创建目标卷积神经网络,包括:
在原始卷积神经网络中的每一层中增加恒等变换单元,得到卷积处理分支,其中,所述恒等变换单元的输出与输入相同;
在原始卷积神经网络中每一层的输入端与输出端之间具有的卷积处理分支的基础上,增加恒等变换分支,得到所述目标卷积神经网络。


3.根据权利要求2所述的方法,其特征在于,原始卷积神经网络中的每一层至少包括:卷积处理单元和批归一化单元;在原始卷积神经网络中的每一层中增加恒等变换单元,得到卷积处理分支,包括:
在原始卷积神经网络中每一层具有的卷积处理单元的基础上,增加恒等变换单元,得到卷积处理分支;
其中,所述卷积处理单元的输出与所述恒等变换单元的输出之和,为批归一化单元的输入。


4.根据权利要求1所述的方法,其特征在于,以所述多个子卷积神经网络中至少部分子卷积神经网络为搜索空间,按照预设的模型搜索算法进行搜索,得到目标子卷积神经网络,包括:
从所述多个子卷积神经网络中筛选完成目标任务的参数值大于预设参数值的候选子卷积神经网络;
根据所述候选子卷积神经网络的各个层中的恒等变换分支的权重,保留或丢弃所述候选子卷积神经网络的各个层中的恒等变换分支,得到与所述目标任务适配的目标子卷积神经网络。


5.根据权利要求1所述的方法,其特征在于,所述预设的模型搜索算法为基于进化算法的模型搜索算法;为所述目标卷积神经网络的各个层中的恒等变换分支和卷积处理分支分别分配相应的权重,得到多个子卷积神经网络,包括:
以预设概率保留或丢弃所述目标卷积神经网络的各个层中的恒等变换分支,得到多个子卷积神经网络;
以所述多个子卷积神经网络中至少部分子卷积神经网络为搜索空间,按照预设的模型搜索算法进行搜索,得到目标子卷积神经网络,包括:
从所述多个子卷积神经网络中筛选完成目标任务的参数值排序靠前的K个子卷积神经网络;
以所述K个子卷积神经网络作为初始化种群,根据完成目标任务的参数值,采用进化算法进行多次筛选,得到目标子卷积神经网络。


6.根据权利要求1所述的方法,其特征在于,所述预设的模型搜索算法为基于强化学习模型的模型搜索算法;为所述目标卷积神经网络的各个层中的恒等变换分支和卷积处理分支分别分配相应的权重,得到多个子卷积神经网络,包括:...

【专利技术属性】
技术研发人员:张选杨
申请(专利权)人:北京迈格威科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1