一种轻量级嵌入式目标检测方法和系统技术方案

技术编号:37234397 阅读:11 留言:0更新日期:2023-04-20 23:16
本发明专利技术提供一种轻量级嵌入式目标检测方法和系统,方法包括以下步骤:S1:以秒为单位获取若干时长的待检测视频,分别将各秒待检测视频按帧分割为多张图像,对应得到若干个图像集;S2:根据要输出的视频帧数n按等长的时间间隔选取n张图像作为待检测图像;S3:利用轻量级目标检测模型对待检测图像进行推理预测,在每相邻的三张待检测图像中分别选取预测置信度最高的预测结果,并将选取的预测结果进行组合,根据组合的结果分别在相应的三张待检测图像中进行框选;S4:将框选好的待检测图像重新合成为视频并输出,完成目标检测。本发明专利技术提供一种轻量级嵌入式目标检测方法和系统,解决了目前的目标检测算法不适用于嵌入式平台的问题。题。题。

【技术实现步骤摘要】
一种轻量级嵌入式目标检测方法和系统


[0001]本专利技术涉及目标检测的
,更具体的,涉及一种轻量级嵌入式目标检测方法和系统。

技术介绍

[0002]图像分类是计算机视觉领域最基础的任务,图像分类的目标就是将不同的图像划分为不同的类别,实现最小的分类误差,对于单标签的图像分类问题,可以分为跨物种语义级别的图像分类、子类细粒度图像分类和实例级图像分类三大类别。所谓跨物种语义级别的图像分类,就是在不同物种的层次上识别不同类别的对象,例如区分猫狗;子类细粒度图像分类指的是同一个大类中子类的分类问题,例如区分不同鸟类;实例级图像分类指的是区分不同的个体,最典型的任务就是人脸识别。
[0003]目标检测是在图像分类的基础上实现多目标分类和实时推理。图像分割、物体追踪、关键点检测等都要依赖于目标检测。目标检测的应用场景主要包括:人脸识别、智慧交通、工业检测、医学图像检测等。将目标检测技术按照检测阶段划分,可以分为两种:单阶段目标检测和两阶段目标检测。其中,单阶段目标检测的检测过程为,首先生成很多候选区域,然后对每个候选区域,使用深度网络提取特征,再把特征送入每一类的分类器,判别是否属于该类,最后使用回归器精细修正候选框的位置,单阶段常用的算法主要包括:R

CNN、SPP

Net、Fast R

CNN和Faster R

CNN。两阶段目标检测的检测过程则没有了生成候选框的步骤,直接使用深度网络,把检测问题转换为了回归问题,主流算法包括:OverFeat、YOLOv1、YOLOv2、YOLOv3、YOLOv3

Tiny、SSD和RetinaNet。
[0004]但目前的目标检测算法大多都是运行在高性能GPU服务器上的,不适用于在低资源的嵌入式平台上进行目标检测分类。

技术实现思路

[0005]本专利技术为克服目前的目标检测算法不适用于嵌入式平台的技术缺陷,提供一种轻量级嵌入式目标检测方法和系统。
[0006]为解决上述技术问题,本专利技术的技术方案如下:
[0007]一种轻量级嵌入式目标检测方法,包括以下步骤:
[0008]S1:以秒为单位获取若干时长的待检测视频,分别将各秒待检测视频按帧分割为多张图像,对应得到若干个图像集;
[0009]S2:在每个图像集中,根据要输出的视频帧数n按等长的时间间隔选取n张图像作为待检测图像;
[0010]S3:利用轻量级目标检测模型对待检测图像进行推理预测,在每相邻的三张待检测图像中分别选取预测置信度最高的预测结果,并将选取的预测结果进行组合,根据组合的结果分别在相应的三张待检测图像中进行框选;
[0011]S4:将框选好的待检测图像重新合成为视频并输出,完成目标检测。
[0012]上述方案中,通过将待检测视频按帧分割,并根据要输出的视频帧数选取出待检测图像,利用轻量级目标检测模型对待检测图像进行推理预测,能够在嵌入式平台上进行目标检测;同时在每相邻的三张待检测图像中分别选取预测置信度最高的预测结果,并将选取的预测结果进行组合,根据组合的结果分别在相应的三张待检测图像中进行框选,提高目标检测的准确度。
[0013]优选的,在利用轻量级目标检测模型对待检测图像进行推理预测之前,还包括以下步骤:
[0014]A1:采集多张图像,并分别对采集的各张图像进行目标标注,对应得到多个带有标注信息的标注文件;
[0015]A2:分别对各张采集的图像和各个标注文件进行数据增强;
[0016]A3:利用增强后的图像和标注文件对预构建的轻量级目标检测模型进行训练,得到训练好的轻量级目标检测模型。
[0017]优选的,标注信息包括目标类别和位置信息。
[0018]优选的,数据增强包括平移变换、翻转变换、随即裁剪、噪声扰动、对比度变换和尺度变换。
[0019]优选的,所述轻量级目标检测模型包括输入层、第一卷积层、第二卷积层、第三卷积层、第四卷积层、第五卷积层、第六卷积层、第七卷积层、第八卷积层、第九卷积层、第十卷积层、第十一卷积层、第十二卷积层、第十三卷积层、第一最大池化层、第二最大池化层、第三最大池化层、第四最大池化层、第五最大池化层、第六最大池化层、平均池化层、上采样层、concat层、第一YOLO层、第二YOLO层和输出层;其中,
[0020]所述输入层、第一卷积层、第一最大池化层、第二卷积层、第二最大池化层、第三卷积层、第三最大池化层、第四卷积层、第四最大池化层、第五卷积层、第五最大池化层、第六卷积层、第六最大池化层、第七卷积层、第八卷积层、第九卷积层、第十卷积层和第一YOLO层依次连接;所述第三卷积层的一分支输出端连接平均池化层的输入端;所述第八卷积层的一分支输出端连接第十一卷积层的输入端,第十一卷积层的输出端连接上采样层的输入端;所述上采样层的输出端、平均池化层的输出端和第五卷积层的一分支输出端分别连接concat层的输入端;所述concat层、第十二卷积层、第十三卷积层和第二YOLO层依次连接;所述第一YOLO层的输出端和第二YOLO层的输出端分别连接输出层的输入端。
[0021]优选的,第一卷积层、第二卷积层、第三卷积层、第四卷积层、第五卷积层、第六卷积层、第七卷积层、第九卷积层和第十二卷积层的卷积核大小均为3
×
3;第八卷积层、第十卷积层、第十一卷积层和第十三卷积层的卷积核大小均为1
×
1;第一最大池化层、第二最大池化层、第三最大池化层、第四最大池化层、第五最大池化层和第六最大池化层的池化窗口形状均为2
×
2。
[0022]优选的,第一卷积层、第二卷积层、第三卷积层、第四卷积层、第五卷积层、第六卷积层、第七卷积层的、第八卷积层、第九卷积层和第十卷积层的卷积核个数分别为16、32、64、128、256、512、1024、256、512、255。
[0023]优选的,所述轻量级目标检测模型的输出包括最终的损失函数值、预测分类和边界框回归数值。
[0024]优选的,在步骤S3进行框选时,还包括在图像上标注预测候选框、预测分类和预测
概率。
[0025]一种轻量级嵌入式目标检测系统,用于实现所述的一种轻量级嵌入式目标检测方法,包括数据获取模块、数据处理模块、推理预测模块;
[0026]数据获取模块,用于以秒为单位获取若干时长的待检测视频;
[0027]数据处理模块,用于分别将各秒待检测视频按帧分割为多张图像,根据要输出的视频帧数n按等长的时间间隔选取n张图像作为待检测图像,以及将框选好的待检测图像重新合成为视频;
[0028]推理预测模块,用于利用轻量级目标检测模型对待检测图像进行推理预测,在每相邻的三张待检测图像中分别选取预测置信度最高的预测结果,并将选取的预测结果进行组合,根据组合的结果分别在相应的三张待检测图像中进行框选。
[0029]与现有技术相比,本专利技术技术方本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种轻量级嵌入式目标检测方法,其特征在于,包括以下步骤:S1:以秒为单位获取若干时长的待检测视频,分别将各秒待检测视频按帧分割为多张图像,对应得到若干个图像集;S2:在每个图像集中,根据要输出的视频帧数n按等长的时间间隔选取n张图像作为待检测图像;S3:利用轻量级目标检测模型对待检测图像进行推理预测,在每相邻的三张待检测图像中分别选取预测置信度最高的预测结果,并将选取的预测结果进行组合,根据组合的结果分别在相应的三张待检测图像中进行框选;S4:将框选好的待检测图像重新合成为视频并输出,完成目标检测。2.根据权利要求1所述的一种轻量级嵌入式目标检测方法,其特征在于,在利用轻量级目标检测模型对待检测图像进行推理预测之前,还包括以下步骤:A1:采集多张图像,并分别对采集的各张图像进行目标标注,对应得到多个带有标注信息的标注文件;A2:分别对各张采集的图像和各个标注文件进行数据增强;A3:利用增强后的图像和标注文件对预构建的轻量级目标检测模型进行训练,得到训练好的轻量级目标检测模型。3.根据权利要求2所述的一种轻量级嵌入式目标检测方法,其特征在于,标注信息包括目标类别和位置信息。4.根据权利要求2所述的一种轻量级嵌入式目标检测方法,其特征在于,数据增强包括平移变换、翻转变换、随即裁剪、噪声扰动、对比度变换和尺度变换。5.根据权利要求1所述的一种轻量级嵌入式目标检测方法,其特征在于,所述轻量级目标检测模型包括输入层、第一卷积层、第二卷积层、第三卷积层、第四卷积层、第五卷积层、第六卷积层、第七卷积层、第八卷积层、第九卷积层、第十卷积层、第十一卷积层、第十二卷积层、第十三卷积层、第一最大池化层、第二最大池化层、第三最大池化层、第四最大池化层、第五最大池化层、第六最大池化层、平均池化层、上采样层、concat层、第一YOLO层、第二YOLO层和输出层;其中,所述输入层、第一卷积层、第一最大池化层、第二卷积层、第二最大池化层、第三卷积层、第三最大池化层、第四卷积层、第四最大池化层、第五卷积层、第五最大池化层、第六卷积层、第六最大池化层、第七卷积层、第八卷积层、第九卷积层、第十卷积层和第一YOLO层依次连接;所述第三卷积层的一分支输出端连接平均池化层的输入端;所述第八卷积层的一分支...

【专利技术属性】
技术研发人员:李广明申京傲郭文龙欧阳裕荣李修成胡泽强
申请(专利权)人:典瑞智能东莞科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1