一种适用小目标检测的改进型YOLOv4网络结构及其应用制造技术

技术编号:33631318 阅读:21 留言:0更新日期:2022-06-02 01:35
本发明专利技术提供了一种适用小目标检测的改进型YOLOv4网络结构:包括两部分改进,一部分为在YOLOv4网络结构中增加一层特征检测层,具体为将原PANet网络中输出的特征图N2上采样后,与CSPDarknet53网络中提取的特征图P2进行融合并卷积,以此作为第四层特征检测层;另一部分为将原YOLOv4网络结构中的SPP模块替换为ASPP模块。本发明专利技术一方面通过新增第四层特征检测层,提取更浅层特征信息,另一方面通过融合ASPP模块,聚合多尺度上下文信息;最终提升YOLOv4神经网络对小尺寸目标的识别能力。YOLOv4神经网络对小尺寸目标的识别能力。YOLOv4神经网络对小尺寸目标的识别能力。

【技术实现步骤摘要】
一种适用小目标检测的改进型YOLOv4网络结构及其应用


[0001]本专利技术属于人工智能图像识别
,具体涉及一种适用于小目标检测的改进型YOLOv4网络结构及其应用。

技术介绍

[0002]近年来,多媒体技术迅猛发展,图像识别技术作为计算机视觉领域中的重要分支,被广泛应用到航天航空领域、军事领域、公共安全领域以及工农业等相关领域。当前对于图像中大尺寸目标物的检测识别,现有卷积神经网络模型已能够做到较为准确地完成。
[0003]然而对于图像中的小尺寸目标,例如针对施工场所工作人员安全帽佩戴的检测识别,因施工场所环境复杂,各场景中监控设备的安装位置不定,获取的监控画面视觉效果不同,检测范围较远,人体头部图像在监控画面中所占像素点较少。这些情况将会导致很多现有神经网络模型的识别准确率大大下降,检测效果不佳;特别是对于某些监控范围广,工作人员视觉效果较小的场景,现有神经网络容易会出现较多的误检、漏检问题。

技术实现思路

[0004]针对现有技术中存在的不足,本专利技术提供了一种适用小目标检测的改进型YOLOv4网络结构及其应用,用以解决现有神经网络对小尺寸目标识别不佳的问题,尤其是改善对施工现场人员安全帽佩戴情况的识别能力。
[0005]本专利技术通过以下技术手段实现上述技术目的。
[0006]一种适用小目标检测的改进型YOLOv4网络结构:在YOLOv4网络结构中增加一层特征检测层:将原PANet网络中输出的特征图N2上采样后,与CSPDarknet53网络中提取的特征图P2进行融合并卷积,以此作为第四层特征检测层。
[0007]进一步地,PANet网络中,将每次特征融合后的卷积次数降低。
[0008]进一步地,PANet网络中,在每次特征融合后进行3次卷积。
[0009]进一步地,网络结构的输入图片大小设为416*416,相应特征图N2的特征尺度为52*52,特征图P2的特征尺度为104*104,PANet输出特征图的特征尺度由浅至深依次为104*104、52*52、26*26和13*13。
[0010]进一步地,将原YOLOv4网络结构中的SPP模块替换为ASPP模块。
[0011]进一步地,所述ASPP模块中采用不同扩张率的混合空洞卷积。
[0012]进一步地,所述混合空洞卷积包括3个卷积核为3*3的空洞卷积,3个空洞卷积的扩张率分别为1、2、3。
[0013]一种上述改进型YOLOv4网络结构的应用:应用所述改进型YOLOv4网络结构对施工场所中的安全帽佩戴情况进行检测识别。
[0014]本专利技术的有益效果为:
[0015](1)本专利技术提供了一种改进型YOLOv4网络结构,一方面通过在原YOLOv4网络结构中增加第四层特征检测层,以此提取更浅层特征信息,另一方面将原网络结构中的SPP模块
替换为ASPP模块,以此聚合多尺度上下文信息;最终通过上述对网络结构方面的改进,提升YOLOv4神经网络对小尺寸目标的识别能力。
[0016](2)为缓解神经网络的计算压力,本专利技术将PANnet中每次融合后的卷积由5次降低为3次,最终经实测验证,改进后的网络结构与原网络结构相比,对于小目标识的别精度提高了2.9%,而检测速度仍保持不变。
[0017](3)本专利技术ASPP模块中采用不同扩张率的混合空洞卷积,以此解决单一空洞卷积所导致的信息连续性受损问题。
附图说明
[0018]图1为原YOLOv4网络结构图;
[0019]图2为本专利技术改进型YOLOv4网络结构图;
[0020]图3为本专利技术ASPP模块结构图;
[0021]图4为空洞卷积示意图;
[0022]图5(a)为原YOLOv4网络对于安全帽佩戴情况的检测识别结果图;
[0023]图5(b)为本专利技术增加特征检测层时的检测识别结果图;
[0024]图5(c)为本专利技术增加特征检测层并融合ASPP模块时的检测识别结果图。
具体实施方式
[0025]下面详细描述本专利技术的实施例,所示实施例的示例在附图中示出,其中自始至终相通或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。
[0026]一、网络结构
[0027]如图1所示为原YOLOv4网络结构,包括特征提取网络CSPDarknet53和路径聚合网络PANnet,对于输入的图片,首先通过CSPDarknet53由浅入深提取出5个不同尺度大小的特征图,分别是P1、P2、P3、P4和P5。对于最常选用大小为416*416的输入图片,P1至P5所对应的特征尺度依次为208*208、104*104、52*52、26*26、13*13。之后通过PANet部分,将CSPDarknet53中提取到的多个不同尺度的特征图进行融合以及多次卷积操作,从而输出3个不同尺度的YOLO head(输出特征图),由浅至深分别为Y3、Y2和Y1,对应的特征尺度依次为52*52、26*26和13*13;最终以此YOLO head来对图像中的目标进行预测,也即完成对目标的检测识别工作。
[0028]如图2所示为本专利技术基于YOLOv4所改进后的网络结构,其中改进之处包括两部分:
[0029]1)增加一层特征检测层:将原PANet网络中输出的特征图N2,进行上采样操作,从而将其特征尺度由52*52提升至104*104,之后再将其与CSPDarknet53网络中提取到的特征图P2(对应特征尺度也是104*104)进行融合以及多次卷积操作,以此作为网络中的第四层特征检测层。本专利技术通过新增的第四层特征检测层,对图像中的更浅层特征进行检测,以此提取到更浅层的信息,实现对更小目标的检测;最终本专利技术改进后的网络结构输出特征图Y4至Y1的特征尺度依次为104*104、52*52、26*26和13*13。
[0030]由于以上改进增加了特征检测层数量,因而会加重网络的计算量,最终导致网络结构的整体检测速度被拖慢。故为缓解上述计算量负担,本专利技术将原PANet网络中每次特征
融合后的5次卷积操作降为3次,以此方式减少计算量。
[0031]2)ASPP替换SPP:在原本YOLOv4网络结构中,使用SPP模块(空间金字塔池化)来提取不同感受野的信息,但是此操作并没有充分体现全局信息和局部信息之间的语法关系。因而本专利技术采用ASPP模块(空洞空间卷积池化金字塔)替换SPP模块,来实现池化操作。考虑到ASPP模块中单一空洞卷积由于存在中间间隔,因而每次卷积都会存在一部分像素不参与计算,导致信息的连续性受到损失;所以本专利技术将ASPP模块的具体结构设计为采用不同扩张率的混合空洞卷积,进而将其与全局平均池化并联,组成一个新的特征金字塔模型,以此聚合多尺度上下文信息,从而在整个神经网络训练的过程中,提升神经网络对不同尺度特征图中同一物体的识别能力,最终达到增强整个卷积神经网络模型识别能本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种适用小目标检测的改进型YOLOv4网络结构,其特征在于:在YOLOv4网络结构中增加一层特征检测层:将原PANet网络中输出的特征图N2上采样后,与CSPDarknet53网络中提取的特征图P2进行融合并卷积,以此作为第四层特征检测层。2.根据权利要求1所述的改进型YOLOv4网络结构,其特征在于:PANet网络中,将每次特征融合后的卷积次数降低。3.根据权利要求2所述的改进型YOLOv4网络结构,其特征在于:PANet网络中,在每次特征融合后进行3次卷积。4.根据权利要求1所述的改进型YOLOv4网络结构,其特征在于:网络结构的输入图片大小设为416*416,相应特征图N2的特征尺度为52*52,特征图P2的特征尺度为104*104,...

【专利技术属性】
技术研发人员:曹雪虹陈颖焦良葆孟琳张嘉超
申请(专利权)人:南京工程学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1