The invention discloses a multi frame integrated target detection algorithm based on time sequence, including: S1, inputting several consecutive frames of pictures to obtain a sequence containing several pictures; S2, extracting image features of the sequence obtained in step S1 to obtain feature tensor of spatial information of the object to be detected; S3, extracting time sequence information contained in several frames of pictures according to the feature tensor obtained in step S2, Obtain a new feature tensor containing timing information; S4. Train the feature tensor obtained in step S3 based on the feature pyramid network, and output the bounding box position, class label and corresponding confidence degree of the object to be detected in each frame of the picture; S5. Draw the bounding box and class label surrounding the object to be detected in each frame of the picture according to the bounding box position and confidence degree of the output And confidence. The invention makes full use of the time sequence information existing between consecutive multi frame images to improve the accuracy of target detection, and solves the problem of small target difficult to recognize by combining with FPN network.
【技术实现步骤摘要】
一种基于时序的多帧集成目标检测算法
本专利技术属于计算机视觉的
,具体涉及一种基于时序的多帧集成目标检测算法。
技术介绍
目标检测一直是计算机视觉中的一个重要问题,目标检测就是讲目标定位与目标分类结合起来,利用图像处理技术、机器学习等多方面的知识,从图像(视频)中定位感兴趣的对象。目标分类负责判断输入的图像中是否包含所需物体(object),目标定位则负责表示目标物体的位置,并用外接矩形框定位。这需要计算机在准确判断目标类别的同时,还要给出每个目标相对精确的位置。随着计算机技术的迅猛发展,目标检测已在人脸识别、行人跟踪、车牌识别、无人驾驶等领域获得了广泛的应用。目前主流的目标检测算法都是基于CNN的,目前主流的算法主要存在以下几方面的问题:1、不能很好的解决目标检测中的多尺度问题,使得对小目标的识别率很低。2、较少的考虑图像前后帧之间的时序关系,大多是只考虑了待检测物体在图像中的位置信息。3、模型训练时间太长,对硬件要求太高。
技术实现思路
本专利技术的目的在于针对现有技术中的上述不足,提供一种基于时序的多帧集成目标检测算法,以解决小目标难以识别的问题。为达到上述目的,本专利技术采取的技术方案是:一种基于时序的多帧集成目标检测算法,其包括:S1、输入连续若干帧图片,得到包含若干张图片的序列;S2、提取步骤S1中所得序列的图像特征,得到待检测对象空间信息的特征张量;S3、根据步骤S2中所得特征张量,提取若干帧图片中蕴含的时 ...
【技术保护点】
1.一种基于时序的多帧集成目标检测算法,其特征在于,包括:/nS1、输入连续若干帧图片,得到包含若干张图片的序列;/nS2、提取步骤S1中所得序列的图像特征,得到待检测对象空间信息的特征张量;/nS3、根据步骤S2中所得特征张量,提取若干帧图片中蕴含的时序信息,得到新的蕴含时序信息的特征张量;/nS4、基于特征金字塔网络,对步骤S3中所得特征张量进行训练,输出待检测物体在每帧图片中的包围盒位置、类标签以及对应的置信度;/nS5、根据输出的包围盒位置以及置信度,在每帧图片中画出包围待检测对象的包围盒、类标签和置信度。/n
【技术特征摘要】
1.一种基于时序的多帧集成目标检测算法,其特征在于,包括:
S1、输入连续若干帧图片,得到包含若干张图片的序列;
S2、提取步骤S1中所得序列的图像特征,得到待检测对象空间信息的特征张量;
S3、根据步骤S2中所得特征张量,提取若干帧图片中蕴含的时序信息,得到新的蕴含时序信息的特征张量;
S4、基于特征金字塔网络,对步骤S3中所得特征张量进行训练,输出待检测物体在每帧图片中的包围盒位置、类标签以及对应的置信度;
S5、根据输出的包围盒位置以及置信度,在每帧图片中画出包围待检测对象的包围盒、类标签和置信度。
2.根据权利要求1所述的基于时序的多帧集成目标检测算法,其特征在于:所述步骤S2具体包括:
将得到的若干张图片序列输入ResNet-50神经网络中提取图像特征,得到包含待检测对象的空间信息的C3、C4、C5层特征张量。
3.根据权利要求2所述的基于时序的多帧集成目标检测算法,其特征在于:所述步骤S2中,输入为n*m*m*3的张量,其中,第一维表示图片数量,第二、三维表示图片分辨率,第四维表示通道数。
4.根据权利要求1所述的基于时序的多帧集成目标检测算法,其特征在...
【专利技术属性】
技术研发人员:陈良银,周良学,谢晓东,黄韫栀,刘伦鑫,廖俊华,段海涵,代湖明,张媛媛,陈彦如,
申请(专利权)人:四川大学,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。