本发明专利技术实施例提供了一种神经网络构建方法、装置、设备及介质,所述方法包括:从原始神经网络中确定每个目标网络模块;在每相邻两个目标网络模块的输出端之间增加一个特征融合模块,得到目标神经网络;其中,针对每个目标网络模块,该目标网络模块的输出端所连接的特征融合模块用于对该目标网络模块之前的各个目标网络模块各自输出的特征图进行融合,得到融合特征图,并输入与该目标网络模块相邻的下一个目标网络模块。采用本实施例的技术方案,在提升模型的预测能力的基础上,还可以减少模型参数、降低模型计算复杂度。
【技术实现步骤摘要】
神经网络构建方法、装置、设备及介质
本专利技术涉及计算机处理
,特别是涉及一种神经网络构建方法、装置、设备及介质。
技术介绍
近年来,随着人工神经网络复杂度的增加,模型的表达能力也随之提升。然而,神经网络模型的复杂度增加虽然能够提升模型的表达能力和性能,但是,随之而来的,模型也会增加的大量参数和计算复杂度,尤其是对于嵌入式设备、自动驾驶领域等资源受限的应用场景下,更不可能无限制的靠增加模型复杂度来提高模型预测性能。因此,为了加快人工智能的落地,需要在保证模型预测准确率的前提下,尽量减小模型的复杂度。相关技术中,一般通过张量分解、模型剪枝、知识蒸馏以及模型量化,对模型进行压缩,以尽可能减少模型参数或者计算复杂度。但是,以上方法均需要通过难度较高和周期漫长的模型训练才能实现,得到上述模型的成本高昂。因此,如何提供一种通用的方法以既减小模型的复杂度又可以尽量压缩成本,成为了亟待解决的技术问题。
技术实现思路
鉴于上述问题,提出了本专利技术实施例的一种神经网络构建方法、装置、设备及介质,以便克服上述问题或者至少部分地解决上述问题。本专利技术实施例的第一方面,公开了一种神经网络构建方法,所述方法包括:从原始神经网络中确定每个目标网络模块;在每相邻两个目标网络模块的输出端之间增加一个特征融合模块,得到目标神经网络;其中,针对每个目标网络模块,该目标网络模块的输出端所连接的特征融合模块用于对该目标网络模块之前的各个目标网络模块各自输出的特征图进行融合,得到融合特征图,并输入与该目标网络模块相邻的下一个目标网络模块。可选地,所述特征融合模块包括顺次连接的注意力子模块和融合子模块;其中,针对每个目标网络模块,该目标网络模块的输出端连接所述注意力子模块的输入端,所述融合子模块的输出端连接与该目标网络模块相邻的下一个目标网络模块的输入端;所述注意力子模块用于针对每个目标网络模块,对该目标网络模块输出的特征图进行处理,以输出该目标网络模块之前的各个目标网络模块各自的权重;所述融合子模块用于针对每个目标网络模块,根据该目标网络模块之前的各个目标网络模块各自的权重,对该目标网络模块之前的各个目标网络模块各自输出的特征图进行加权处理,得到融合特征图,并输入与该目标网络模块相邻的下一个目标网络模块。可选地,所述注意力子模块包括顺次连接的全局池化层、第一全连接层、第一激活函数层、第二全连接层、第二激活函数层;其中,所述第一激活函数层的激活函数不同于所述第二激活函数层的激活函数;针对每个目标网络模块,所述第二全连接层的输出维度为该目标网络模块之前的各个目标网络模块的数量。可选地,所述第一激活函数层的激活函数为ReLU激活函数,所述第二激活函数层的激活函数为Sigmoid激活函数。可选地,在得到目标神经网络之后,所述方法还包括:对所述目标神经网络进行模型压缩,或,对所述目标神经网络进行轻量级处理,所述模型压缩的方式包括以下至少一者:张量分解、模型剪枝、知识蒸馏以及模型量化。可选地,在得到目标神经网络之后,所述方法还包括:以样本图像集为训练样本,对所述目标神经网络进行训练,得到图像处理模型,所述图像处理模型进行物体识别或分类。可选地,在得到图像处理模型之后,所述方法还包括:获得待处理图像;将所述待处理图像输入所述图像处理模型,得到所述图像处理模型输出的处理结果,所述处理结果为所述待处理图像的分类结果或所述待处理图像包含的物体的识别结果。本专利技术实施例的第二方面,提供一种神经网络构建装置,所述装置包括:确定模块,用于从原始神经网络中确定每个目标网络模块;模块添加模块,用于在每相邻两个目标网络模块的输出端之间增加一个特征融合模块,得到目标神经网络;其中,针对每个目标网络模块,该目标网络模块的输出端所连接的特征融合模块用于对该目标网络模块之前的各个目标网络模块各自输出的特征图进行融合,得到融合特征图,并输入与该目标网络模块相邻的下一个目标网络模块。本专利技术实施例还公开了一种电子设备,包括:包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行时实现如第一方面实施例所述的神经网络构建方法。本专利技术实施例还公开了一种计算机可读存储介质,其存储的计算机程序使得处理器执行如本专利技术第一方面实施例所述的神经网络构建方法。本专利技术实施例包括以下优点:在本专利技术实施例中,可以从原始神经网络中确定每个目标网络模块;从而在每相邻两个目标网络模块的输出端之间增加一个特征融合模块,得到目标神经网络;其中,针对每个目标网络模块,该目标网络模块的输出端所连接的特征融合模块用于对该目标网络模块之前的各个目标网络模块各自输出的特征图进行融合,得到融合特征图,并输入与该目标网络模块相邻的下一个目标网络模块。其中,由于在每个目标网络模块的输出端连接了一个特征融合模块,该特征融合模块可以将该目标网络模块之前的各目标网络模块所输出的特征图进行融合后,再输入到下一目标网络模块,如此,每个目标网络模块可以搜集不同的目标网络模块所输出的特征图,如此,使得每个目标网络模块均充分复用了其他目标网络模块输出的特征图,从而充分利用了特征图中的特征,进而提高预测准确度。又由于一般特征融合模块的参数量小计算难度低,因此在提升模型的预测准确度的基础上,还可以减少模型参数、降低模型计算复杂度。这样,可以避免通过训练过程对模型进行压缩,从而可以采用通用的模型训练方法训练该模型,如此降低了训练成本。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例中提出的总的技术构思示意图;图2是本专利技术实施例中一种神经网络构建方法的步骤流程图;图3是本专利技术实施中一种目标神经网络的网络结构图;图4是本专利技术实施中一种注意力子模块的结构示意图;图5是本专利技术实施中一种神经网络构建装置的结构框图。具体实施方式为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。为解决相关技术中模型复杂度高、训练成本高的问题,本申请实施例提出了如下技术构思:在特征图的处理过程中,神经网络中的每个目标网络模块可以搜集之前的不同目标网络模块输出的特征图,则该目标网络模块的输入便由对之前搜集到的所有目标网络模块输出的特征图进行加权求和后得到的。如此,可以充分复用各个目标网络模块输出的特征图,以本文档来自技高网...
【技术保护点】
1.一种神经网络构建方法,其特征在于,所述方法包括:/n从原始神经网络中确定目标网络模块;/n在每相邻两个目标网络模块的输出端之间增加特征融合模块,得到目标神经网络;/n其中,针对每个目标网络模块,该目标网络模块的输出端所连接的特征融合模块用于对该目标网络模块之前的各个目标网络模块各自输出的特征图进行融合,得到融合特征图,并将所述融合特征图输入与该目标网络模块相邻的下一个目标网络模块。/n
【技术特征摘要】
1.一种神经网络构建方法,其特征在于,所述方法包括:
从原始神经网络中确定目标网络模块;
在每相邻两个目标网络模块的输出端之间增加特征融合模块,得到目标神经网络;
其中,针对每个目标网络模块,该目标网络模块的输出端所连接的特征融合模块用于对该目标网络模块之前的各个目标网络模块各自输出的特征图进行融合,得到融合特征图,并将所述融合特征图输入与该目标网络模块相邻的下一个目标网络模块。
2.根据权利要求1所述的方法,其特征在于,所述特征融合模块包括顺次连接的注意力子模块和融合子模块;
其中,针对每个目标网络模块,该目标网络模块的输出端连接所述注意力子模块的输入端,所述融合子模块的输出端连接与该目标网络模块相邻的下一个目标网络模块的输入端;
所述注意力子模块用于针对每个目标网络模块,对该目标网络模块输出的特征图进行处理,以输出该目标网络模块之前的各个目标网络模块各自的权重;
所述融合子模块用于针对每个目标网络模块,根据该目标网络模块之前的各个目标网络模块各自的权重,对该目标网络模块之前的各个目标网络模块各自输出的特征图进行加权处理,得到融合特征图,并输入与该目标网络模块相邻的下一个目标网络模块。
3.根据权利要求2所述的方法,其特征在于,所述注意力子模块包括顺次连接的全局池化层、第一全连接层、第一激活函数层、第二全连接层、第二激活函数层;
其中,所述第一激活函数层的激活函数不同于所述第二激活函数层的激活函数;
针对每个目标网络模块,所述第二全连接层的输出维度为该目标网络模块之前的各个目标网络模块的数量。
4.根据权利要求3所述的方法,其特征在于,所述第一激活函数层的激活函数为ReLU激活函数,所述第二激活函数层的激活函数为Sigmoid激...
【专利技术属性】
技术研发人员:张选杨,
申请(专利权)人:北京迈格威科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。