一种基于卷积神经网络的多目标检测方法技术

技术编号:28708414 阅读:22 留言:0更新日期:2021-06-05 23:16
本发明专利技术公开了一种基于卷积神经网络的多目标检测方法。主要解决了现有实时目标检测方法对小目标检测精度不足的技术问题。其实现方案包括:获取待检测目标的图像数据;将图像数据通过卷积神经网络分析获得多层特征图;将多层特征图通过特征融合网络进行融合,学习不同感受野分支的重要程度后,再将高层全局语义信息和底层局部细节信息融合输出,获得第三融合特征图;最后将第三融合特征图根据预设尺度生成候选框,利用候选框分析处理获得目标检测结果,实现多目标检测。本发明专利技术通过融合多层特征图的信息加强特征之间信息相关性,能够有效提高多目标检测的准确度。高多目标检测的准确度。高多目标检测的准确度。

【技术实现步骤摘要】
一种基于卷积神经网络的多目标检测方法


[0001]本专利技术涉及人工智能
,具体涉及一种基于卷积神经网络的多目标检测方法。

技术介绍

[0002]自从深度学习发展以来,计算机视觉逐渐成为国内外非常热门的研究方向。所谓计算机视觉,即是让计算机拥有类似人类的视觉,能够“看到”外界的信息,拥有人类对信息的处理能力,包括图像分类、目标检测、目标跟踪和图像分割等任务,其中目标检测是其中的基础一环,对后续的目标跟踪等任务具有至关重要的作用。多目标检测的任务是将一张图像中感兴趣的所有目标用包围框标注出来,并获取该目标的类别信息。
[0003]近年来,随着视频监控系统的迅猛发展和普及应用,图像、视频数据量急剧增长,如何对采集到的图像、视频数据实现实时检测成为研究的热点。
[0004]目前主流的目标检测算法分为双阶段、单阶段和anchor

free的算法。双阶段算法在检测网络之前包括两个步骤,特征提取网络和一个额外的卷积神经网络称为区域建议网络RPN,RPN用来生成只包含预测目标的候选框,然后将预测框送入后面的检测网络进行目标的定位和识别,这类方法以faster

RCNN系列为代表,需要通过额外的区域建议网络去生成高质量的预测框。单阶段的检测算法是一种基于回归方法的算法,直接在网络中提取特征通过预设的anchor来预测物体类别和位置,不需要产生候选区域。所以,双阶段的目标检测算法和单阶段的目标检测算法的主要差别在于是否使用候选区域生成网络。通常使用候选区域生成网络的双阶段模型的准确度比较高,但是相对来讲单阶段的算法在单个图像的检测任务中处理的速度更快,单阶段方法的代表是yolo系列以及SSD系列。近年来anchor

free的方法也逐渐成为新的研究方向,比如cornerNET等方法通过预测框的角点来检测目标,但是这类方法的检测速度相较单阶段方法还是较慢。所以在本专利技术中选择yolo系列方法作为基础框架,yolo是一种基于anchor的端到端的多目标检测算法,该算法在拥有较高的检测精度的同时也具有很好的实时性。最新的yolov5可以通过参数灵活控制卷积神经网络的深度和宽度。yolo算法虽然速度很快,但是利用卷积神经网络提取特征时,随着网络深度不断加深,提取到的特征更多是语义信息,而空间信息很少,导致小目标特征难以被学习,使得算法整体准确度下降。

技术实现思路

[0005]本专利技术目的在于针对上述现有技术的不足,提出一种基于卷积神经网络的多目标检测方法,用于解决现有实时目标检测方法对小目标检测精度不足的技术问题。首先获取待检测目标的图像数据;将图像数据通过卷积神经网络分析获得多层特征图;然后将多层特征图通过特征融合网络进行融合,学习不同感受野分支的重要程度后,再将高层全局语义信息和底层局部细节信息融合输出,获得第三融合特征图;最后将第三融合特征图根据预设尺度生成候选框,利用候选框分析处理获得目标检测结果。本专利技术通过融合多层特征
图的信息加强特征之间信息相关性,能够有效提高多目标检测的准确度,实现多目标检测。
[0006]本专利技术实现上述目的具体步骤如下:
[0007](1)获取待检测目标的图像数据;
[0008](2)将yolov5检测框架中的CSPDarknet53网络作为提取特征的卷积神经网络;
[0009](3)利用卷积神经网络从图像数据中进行特征提取,输出多层特征图;
[0010](4)将特征图中的信息进行融合,获得第三融合特征图:
[0011](4.1)在每层特征图分别提取不同尺度感受野的特征并融合输出,得到第一融合特征图;
[0012](4.2)将每层的第一融合特征图与其下一层的第一融合特征图再次进行融合,得到第二融合特征图;
[0013](4.3)通过注意力机制将每层的第一融合特征图加权融合至第二融合特征图,获得第三融合特征图;
[0014](5)根据预设的anchor参数在第三融合特征图上生成候选框,利用全卷积层对候选框进行回归和分类,得到目标的位置信息、分类分数和置信度分数,完成目标检测。
[0015]本专利技术与现有技术相比具有以下优点:
[0016]第一、本专利技术通过学习不同感受野分支的重要程度融合特征图,并进一步通过高层全局语义信息与底层局部细节相融合加强语义信息和空间信息的相关性,从而能够更好的融合特征,提高算法精度;
[0017]第二、由于本专利技术采用焦点损失函数结合TOU信息作为分类损失函数,使检测网络可以给容易区分的样本添加较小权重、给难以区分的样本添加较大权重,有效提升了目标检测结果的准确率。
附图说明
[0018]图1为本专利技术方法的实现流程图;
[0019]图2为本专利技术的门控空间金字塔空洞卷积网络结构示意图;
[0020]图3为本专利技术中门控机制的网络示意图;
[0021]图4为本专利技术中注意力机制的网络示意图;
[0022]图5为本专利技术的特征融合网络示意图;
[0023]图6为根据本专利技术方法检测原理搭建的检测系统示意图。
具体实施方式
[0024]为了更进一步阐述本专利技术为达成预定专利技术目的所采取的技术手段及功效,以下结合附图及较佳实施例对本专利技术做进一步的描述。
[0025]实施例1:
[0026]参照附图1,本专利技术提出的一种基于卷积神经网络的多目标检测方法,包括如下步骤:
[0027]步骤S1:获取待检测目标的图像数据;
[0028]本专利技术实施例将多目标检测方法应用到工业相机接口图像采集平台上,利用工业相机采集图像数据实现多目标检测,使得应用范围和环境更加广泛。
[0029]步骤S2:提取图像数据获得多层特征图。
[0030]本专利技术实施例选取yolov5检测框架作为改进的基准模型,工业相机获取图像数据后,将图像数据进行随机缩放、随机裁剪、随机排布等方式进行拼接,丰富检测数据集。
[0031]利用yolov5检测框架中的主干网络,将yolov5检测框架中的CSPDarknet53网络作为提取特征的卷积神经网络;利用卷积神经网络从图像数据中进行特征提取,输出多层特征图。由于yolov5主干网络结构为公知技术在此不多赘述。每层特征图包含的信息具有差异,高层特征拥有更多的用于分类的全局语义信息,底层特征拥有更多的用于定位的局部细节信息。
[0032]步骤S3:将特征图中的信息进行融合,获得第三融合特征图:
[0033]卷积神经网络获得的多个特征图拥有不同尺度的感受野,首先在每层特征图分别提取不同尺度感受野的特征,学习不同尺度感受野分支的重要程度并将其融合输出,获得图像数据更加细粒度的第一融合特征图;然后将每层的第一融合特征图与其下一层的第一融合特征图再次进行融合,得到第二融合特征图;最后通过注意力机制将每层的第一融合特征图加权融合至第二融合特征图,获得第三融合特征图,将高层的全局语义信息通过注意力机制映射到低层特征上,用来引本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于卷积神经网络的多目标检测方法,其特征在于,包括如下步骤:(1)获取待检测目标的图像数据;(2)将yolov5检测框架中的CSPDarknet53网络作为提取特征的卷积神经网络;(3)利用卷积神经网络从图像数据中进行特征提取,输出多层特征图;(4)将特征图中的信息进行融合,获得第三融合特征图:(4.1)在每层特征图分别提取不同尺度感受野的特征并融合输出,得到第一融合特征图;(4.2)将每层的第一融合特征图与其下一层的第一融合特征图再次进行融合,得到第二融合特征图;(4.3)通过注意力机制将每层的第一融合特征图加权融合至第二融合特征图,获得第三融合特征图;(5)根据预设的anchor参数在第三融合特征图上生成候选框,利用全卷积层对候选框进行回归和分类,得到目标的位置信息、分类分数和置信度分数,完成目标检测。2.根据权利要求1所述的方法,其特征在于:步骤(1)中的图像数据通过...

【专利技术属性】
技术研发人员:肖嵩张兆琦杨子轩杨翌晗张同振董文倩曲家慧
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1