当前位置: 首页 > 专利查询>北京大学专利>正文

基于多信息路径聚合的特征金字塔神经网络架构搜索方法技术

技术编号:28213234 阅读:149 留言:0更新日期:2021-04-24 14:52
本发明专利技术公布了一种基于多信息路径聚合的特征金字塔神经网络架构搜索方法,构建多种基本信息路径,建立全连接的有向无环图超网,搜索得到由多种基本信息路径聚合而成的多路径聚合特征金字塔网络;将多路径聚合特征金字塔网络嵌入各种骨干网络之后,增强由骨干网络提取到的特征表达;实际应用包括但不限于物体检测,实例分割,语义分割,关键点检测;本发明专利技术能够实现高效、有效的搜索,将搜索到特征金字塔网络嵌入检测器的骨干网络与检测器头之间,检测器其他部分的网络结构不需要改变,方法简单方便,且物体检测精度高,同时还降低检测器的参数量和计算复杂度。参数量和计算复杂度。参数量和计算复杂度。

【技术实现步骤摘要】
基于多信息路径聚合的特征金字塔神经网络架构搜索方法


[0001]本专利技术属于计算机视觉
,涉及利用计算机视觉及深度学习技术进行多尺度特征抽取,尤其涉及一种基于多信息路径聚合的特征金字塔神经网络架构搜索方法,可用于通用物体检测。

技术介绍

[0002]近年来,机器学习研究和应用得到了蓬勃发展。其中,深度学习方法已在许多应用领域(例如计算机视觉,语音处理和机器翻译)中取得了关键性的进步,这当中一个重要原因是新型神经网络架构的出现。深度学习在感知任务中的成功很大程度上归功于其对特征工程流的自动化:从数据中以端到端的方式提取层次化特征。然而,不同任务对特征表达的需求不同,在实际应用中,研究者手动设计了越来越多复杂的神经网络架构,这是一个耗时且容易出错的过程。研究者需要针对不同的任务手动设计合适的神经网络架构、训练配置、正则化方法和超参数,来使得手动设计的网络能够在目标任务中达到理想表现。同时,网络的性能表现对设计细节非常敏感,因此,对于每个不同任务,都必须重复这样的手动设计过程。即使是有丰富经验的研究员,也需要反复试验,直到为特定任务确定一套适本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于多信息路径聚合的特征金字塔神经网络架构搜索方法,构建多种基本信息路径,以基本信息路径作为搜索单元,建立全连接的有向无环图超网,搜索多种基本信息路径之间的最优聚合方式,得到由多种基本信息路径聚合而成的多路径聚合特征金字塔颈网络;将多路径聚合特征金字塔网络嵌入各种骨干网络之后,增强由骨干网络提取到的特征表达;应用包括物体检测,实例分割,语义分割,关键点检测;对于物体检测和实例分割,输入待检测的图片到检测器,经骨干网络提取特征,经多路径聚合特征金字塔网络增强特征,最后由检测器头输出检测结果;对于语义分割,输入待分割图片到骨干网络提取特征,经多路径聚合特征金字塔网络增强编码特征,最后由解码器输出分割结果,进而提高语义分割的精度;对于关键点检测,输入待检测图片到骨干网络提取特征,经多路径聚合特征金字塔网络增强,将增强后的特征输入关键点子网络中,输出检测结果;包括如下步骤:1)构建多种基本信息路径,分别以不同方式融合高级别特征和低级别特征,生成特征金字塔;将待检测或待分割图像输入到输入特征金字塔,得到多级金字塔特征;低级别特征包括:第二级骨干网络P2特征、第三级骨干网络P3特征;高级别特征包括第四级骨干网络P4特征和第五级骨干网络P5特征;构建的多种基本信息路径,融合高级别特征和低级别特征,输出融合后的多级别特征,即输出特征金字塔,包括:第二级输出特征F2,第三级输出特征F3,第四级输出特征F4,第五级输出特征F5;多种基本信息路径包括:a)自顶向下信息路径:该路径按自上而下的顺序生成输出特征金字塔,即优先生成第五级输出特征;每级输出特征通过融合相同级别的输入特征和更高级别的输出特征来得到;b)自底向上信息路径:该路径按自底向上的顺序生成输出特征金字塔,最低级别特征最先生成;每级输出特征通过融合相同级别的输入特征和更低级别的输出特征得到;c)尺度平衡信息路径:该路径按相邻特征共享卷积的方式生成输出特征金字塔;d)融合拆分信息路径:该路径首先组合较高级别和较低级别的输入特征,然后将组合的特征拆分为多尺度输出特征金字塔;即将高级别的两个输入特征合并到小融合特征

s
中,将低级别层的两个输入特征合并到大融合特征

l
中;用逐点加法分别合并高级别和低级别特征后,进一步用拼接方法合并小融合特征

s
和大融合特征

l
;融合操作后,得到增强的小融合特征β
s
、增强的大融合特征β
l
;再将增强的小融合特征β
s
、增强的大融合特征β
l
缩放至不同尺寸,得到输出特征金字塔;e)残差连接信息路径:将输入特征金字塔直接映射到输出;f)空信息路径:将输入金字塔映射到输出节点O;2)基于所述基本信息路径构建超网,设置最优子网络为搜索目标,通过一步搜索方法进行搜索,找到最优子网络,即多路径聚合特征金字塔网络;超网是一个全连接的有向无环多图,有N+2个节点,包括输入节点P和输出节点O,N表示中间节点数量;节点代表一个特征金字塔,两个节点之间的边分别代表基本信息路径;搜索目标是在搜索空间中找到最优子网络,即多路径聚合特征金字塔网络;搜索空间中包含多个子网络,不同的子网络代表基本信息路径的不同聚合方式;子网络是一个有向无环图,每
两个节点i和节点j之间有1条边IP(i,j),表示基本信息路径;一步搜索方法包括两个步骤:a)超网训练,b)最优子网络搜索;a)超网训练:每次数据迭代采样K个子网络;K个子网络之间信息路径分布方式没有重复;在训练时给每条边加一个权重γ
i,j
,表示节点x
i
和节点x
j
之间边的重要性;在子网络中,每一个中间节点x
i
(i=1,2,

,N)...

【专利技术属性】
技术研发人员:王勇涛梁婷婷汤帜
申请(专利权)人:北京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1