一种目标检测方法及系统技术方案

技术编号:36222050 阅读:20 留言:0更新日期:2023-01-04 12:20
本发明专利技术涉及计算机视觉技术领域,公开了一种目标检测方法及系统,方法包括:获取图像数据集;对目标检测模型进行训练,将测试集输入训练好的目标检测模型进行检测,得到目标检测结果;其中,目标检测模型包括依次连接的CSPDarknet53

【技术实现步骤摘要】
一种目标检测方法及系统


[0001]本专利技术涉及计算机视觉
,更具体地,涉及一种目标检测方法及系统。

技术介绍

[0002]图像目标检测是指对图像中的目标进行位置检测并进行分类,是一种应用场景较广的技术,比如高级驾驶辅助系统中都会配置有目标检测模块。
[0003]目前的目标检测算法常用YOLOv4

tiny作为检测网络,利用Yolov4

tiny自带的权重对车辆目标进行检测,然而这种利用YOLOv4

tiny自带权重的目标检测算法在实际车载交通目标检测场景场景下,存在着检测速度低且精度低的缺陷。

技术实现思路

[0004]本专利技术为克服现有目标检测方法存在的检测速度低且精度低的缺陷,提供一种目标检测方法及系统。
[0005]为解决上述技术问题,本专利技术的技术方案如下:
[0006]第一个方面,本专利技术提出一种目标检测方法,包括:
[0007]获取图像数据集。所述图像数据集包括训练集和测试集。
[0008]利用所述训练集对目标检测模型进行训练,直至所述目标检测模型的损失函数收敛,得到训练好的目标检测模型。
[0009]将所述测试集输入训练好的目标检测模型进行检测,得到目标检测结果。
[0010]其中,所述目标检测模型为改进的YOLOv4

tiny模型,包括依次连接的CSPDarknet53

tiny特征提取网络、自适应合成金字塔特征融合网络和检测头输出模块。所述CSPDarknet53

tiny特征提取网络对输入图像进行特征提取,输出至少一个特征图。所述自适应合成金字塔特征融合网络对所述CSPDarknet53

tiny特征提取网络输出的至少一个特征图进行融合处理,得到融合特征图。所述检测头输出模块根据所述融合特征图进行目标检测,输出目标检测结果。
[0011]第二个方面,本专利技术还提出一种目标检测系统,包括:
[0012]获取模块,用于获取图像数据集。所述图像数据集包括训练集和测试集。
[0013]训练模块,用于利用所述训练集对目标检测模型进行训练,直至所述目标检测模型的损失函数收敛,得到训练好的目标检测模型。
[0014]检测模块,用于将所述测试集输入训练好的目标检测模型进行检测,得到目标检测结果。
[0015]其中,所述目标检测模型为改进的YOLOv4

tiny模型,包括依次连接的CSPDarknet53

tiny特征提取网络、自适应合成金字塔特征融合网络和检测头输出模块。所述CSPDarknet53

tiny特征提取网络对输入图像进行特征提取,输出至少一个特征图。所述自适应合成金字塔特征融合网络对所述CSPDarknet53

tiny特征提取网络输出的至少一个特征图进行融合处理,得到融合特征图。所述检测头输出模块根据所述融合特征图进行目
标检测,输出目标检测结果。
[0016]与现有技术相比,本专利技术技术方案的有益效果是:本专利技术通过参数量较少的CSPDarknet53

tiny特征提取网络提取特征图,并利用自适应合成金字塔特征融合网络将CSPDarknet53

tiny特征提取网络输出的高层次特征图的语义信息和低层次特征图的位置空间信息进行融合,能够减小目标检测网络模型计算参数量,保证高检测速度的同时,进一步提高了模型的的精度和准确率,使得网络轻量化与高精度达到了更好的权衡,满足实际应用场景对模型大小与准确性的需求。
附图说明
[0017]图1为本申请实施例中目标检测模型的结构示意图。
[0018]图2为本申请实施例中的目标检测方法的流程图。
[0019]图3为本申请实施例中的对经过格式转换处理的图像数据集进行数据扩充的流程图。
[0020]图4为本申请实施例中的通过K

means++方法对经过扩充的图像数据集进行聚类的流程图。
[0021]图5为本申请实施例中的对训练集进行数据增强的流程图。
[0022]图6为本申请实施例中带有通道混洗机制的深度可分离卷积模块的结构示意图。
[0023]图7为本申请实施例中CSP结构模块的结构示意图。
[0024]图8为本申请实施例中Coordinate Attention模块的结构示意图。
[0025]图9为本申请实施例中自适应合成金字塔特征融合网络、快速空间金字塔池化模块和合成融合模块的结构示意图。
[0026]图10为本申请实施例中的目标检测系统的流程图。
具体实施方式
[0027]附图仅用于示例性说明,不能理解为对本专利的限制;
[0028]为了便于对本专利技术实施例进行说明,预先对本专利技术实施例涉及的基本概念进行如下介绍:
[0029]YOLOv4

tiny大体框架与YOLOv3类似,是YOLOv4网络的精简版。YOLOv4

tiny整个网络结构共有38层。其首先将大小假设为n
×
n的图片输入YOLOv4

tiny网络的backbone后,会得到下采样16倍的特征以及下采样32倍的特征,然后把这两个特征输入到特征融合网络将两个特征充分融合,最后得到检测头的输出为h
×
w
×
n
×
(5+N),其中h和w分别是得到特征图的高和宽,n为特征图上每一个点的锚框个数,N为检测类别数,5为预选框的中心点与宽高以及每个类别的置信度。例如,将输入图片大小调整为416
×
416输入到进YOLOv4

tiny网络中,设置每个点的锚框数为3,检测类别数N为8,图片经过backbone网络进行特征提取后将得到26
×
26
×
256的特征图以及13
×
13
×
512的特征图,输入到Neck网络以及Head后最终得到的输出分别为26
×
26
×
39以及13
×
13
×
39。最后还需要取出每一类得分大于先前设置的IoUthreshold(通常设置为50%和75%等)的框和得分,再通过非极大值抑制算法得到最后的框与检测结果。
[0030]下面结合附图和实施例对本专利技术的技术方案做进一步的说明。
[0031]实施例一
[0032]本实施例提出一种目标检测方法,包括:
[0033]获取图像数据集;所述图像数据集包括训练集和测试集;
[0034]利用所述训练集对目标检测模型进行训练,直至所述目标检测模型的损失函数收敛,得到训练好的目标检测模型;
[0035]将所述测试集输入训本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标检测方法,其特征在于,包括:获取图像数据集;所述图像数据集包括训练集和测试集;利用所述训练集对目标检测模型进行训练,直至所述目标检测模型的损失函数收敛,得到训练好的目标检测模型;将所述测试集输入训练好的目标检测模型进行检测,得到目标检测结果;其中,所述目标检测模型为改进的YOLOv4

tiny模型,包括依次连接的CSPDarknet53

tiny特征提取网络、自适应合成金字塔特征融合网络和检测头输出模块;所述CSPDarknet53

tiny特征提取网络对输入图像进行特征提取,输出至少一个特征图;所述自适应合成金字塔特征融合网络对所述CSPDarknet53

tiny特征提取网络输出的至少一个特征图进行融合处理,得到融合特征图;所述检测头输出模块根据所述融合特征图进行目标检测,输出目标检测结果。2.根据权利要求1所述的目标检测方法,其特征在于,所述CSPDarknet53

tiny特征提取网络包括依次连接的第一卷积模块、第二卷积模块、第一CSP模块、第二CSP模块、第三CSP模块、第三卷积模块和第四卷积模块;其中,所述第一卷积模块、第二卷积模块和第三卷积模块为带有通道混洗机制的深度可分离卷积模块;所述第四卷积模块为空间深度可分离卷积融合模块;所述第一CSP模块、第二CSP模块和第三CSP模块为在普通的CSP模块的基础上将所有普通卷积模块替换为带有通道混洗机制的深度可分离卷积模块的CSP结构模块。3.根据权利要求1所述的目标检测方法,其特征在于,所述自适应合成金字塔特征融合网络包括普通卷积模块、自适应平均池化模块、快速空间金字塔池化模块和合成融合模块;所述CSPDarknet53

tiny特征提取网络输出的特征图通过所述普通卷积模块统一通道数后,传输至所述自适应平均池化模块进行自适应平均池化处理;经过自适应平均池化处理后的特征图传输至快速空间金字塔池化模块进行快速空间金字塔池化处理;经过快速空间金字塔池化处理后的特征图传输至合成融合模块进行特征融合,得到融合特征图。4.根据权利要求1所述的目标检测方法,其特征在于,所述CSPDarknet53

tiny特征提取网络输出的特征图通过下采样8倍的浅层输出层传输至所述自适应合成金字塔特征融合网络。5.根据权利要求1所述的目标检测方法,其特征在于,所述空间深度可分离卷积融合模块包括若干个并联的带有通道混洗机制的深度可分离卷积模块和Coordinate Attention模块;所述若干个并联的带有通道混洗机制的深度可分离卷积模块输出的特征图经过拼接处理后,再经过一个卷积核为1
×
1的普通卷积传输至所述Coordinate Attention模块。6.根据权利要求1所述的目标检测方法,其特征在于,所述目标检测模型的损失函数的表达式如下所示:
其中,ρ2表示预测检测框和真实检测框中心点之间的距离,b表示预测检测框中心点的坐标,b
real
表示真实检测框中心点的坐标,c表示预测检测框和真实检测框的最小外接矩形对角线的长度,v为度量预测检测框和真实检测框高宽比的相似性参数,α为权重函数,w表示预测检测框的宽,w
real
表示真实检测框的宽,...

【专利技术属性】
技术研发人员:邓耀宇谭台哲
申请(专利权)人:河源市湾区数字经济技术创新中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1