【技术实现步骤摘要】
一种实时视频流对象检测和跟踪方法
本专利技术涉及视频图像分析
,具体为一种实时视频流对象检测和跟踪方法。
技术介绍
摄像机在手机等移动电子设备上几乎无处不在。通常可以通过理解由照相机捕捉的场景的内容来改进由照相机捕捉的图像和视频。例如,对诸如面部的对象的检测可以允许基于检测对象的位置、移动和照明条件来控制照相机参数,诸如焦距和白平衡。然而,可靠的目标检测技术通常是一个计算密集型、耗电量大且离线的过程。本专利技术合理设置了检测帧和跟踪帧的分配,设置合理的检测和跟踪规则,减小综合的计算量,加快计算速度和跟踪的实时性;又优化了用于检测和跟踪的神经网络结构,这不仅可以减小计算量,快速训练神经网络,快速降低损失,提高追踪的精度。
技术实现思路
本专利技术的目的在于提供一种实时视频流对象检测和跟踪方法,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种实时视频流对象检测和跟踪方法,包括以下步骤:A、对输入视频的第一帧子集执行对象检测;B、在第一帧子集中的第一 ...
【技术保护点】
1.一种实时视频流对象检测和跟踪方法,其特征在于:包括以下步骤:/nA、对输入视频的第一帧子集执行对象检测;/nB、在第一帧子集中的第一检测帧中检测物体和物体位置;/nC、在第一检测帧之后,跟踪检测到的对象以更新输入视频的第二帧子集上的对象位置,其中第一帧子集和第二帧子集不重叠。/n
【技术特征摘要】
1.一种实时视频流对象检测和跟踪方法,其特征在于:包括以下步骤:
A、对输入视频的第一帧子集执行对象检测;
B、在第一帧子集中的第一检测帧中检测物体和物体位置;
C、在第一检测帧之后,跟踪检测到的对象以更新输入视频的第二帧子集上的对象位置,其中第一帧子集和第二帧子集不重叠。
2.根据权利要求1所述的一种实时视频流对象检测和跟踪方法,其特征在于:对所述输入视频进行划分,使得所述第一帧子集对应于每第N个帧,N是所选择的数量,并且所述第二帧子集对应于其余的帧。
3.根据权利要求1所述的一种实时视频流对象检测和跟踪方法,其特征在于:当在第一检测帧之后的选定数量的连续帧中没有检测到对象时结束跟踪;当对象的跟踪分数低于跟踪阈值时结束跟踪。
4.根据权利要求3所述的一种实时视频流对象检测和跟踪方法,其特征在于:基于在第一检测帧中检测到的对象的特征来分配跟踪分数;基于检测对象的属性,在帧的第一子集上确定每个检测对象的跟踪阈值。
5.根据权利要求1所述的一种实时视频流对象检测和跟踪方法,其特征在于:将ID与第一帧子集的检测对象相关联;基于所述ID来关联在第一子集的不同帧中检测到的对象;在第一子集的帧上确定对象的边界框;以及在第二子集的帧上确定边界框的变化;当在第一子集中的第二检测帧上未检测到对象时,在第二检测帧上跟踪该对象。
6.一种实时视频流对象跟踪系统,其特征在于:包括对象检测单元,对象跟踪单元,数据关联单元;其中对象检测单元用于对输入视频的帧的第一子集执行对象检测;对象跟踪单元用于基于每个检测到的对象的跟踪阈值,在输入视频的帧的第二子集上跟踪检测单元先前检测到的对象的位置;其中第二子集和第一子集是互斥的;所述对象检测单元包含帧存储器、神经网络权重、检测神经网络和裁剪单元;该神经网络是以级联卷积神经网络MTCNN为基础进行优化的结构,该神经网络包含三个子网络,分别称之为P-Net,R-Net,O-Net,三个网络组成一个级联结构;基于检测神经网络确定的对象的位置裁剪存储在帧存储器中的检测帧,裁剪后的对象图像提供给对象跟踪单元、跟踪神经网络和对象分析单元。
7.根据权利要求6所述的一种实时视频流对象跟踪系统,其特征在于:所述对象跟踪单元包含神经网络权重和跟踪神经网络,其中,权重信息是预先训练好的参数;该神经网络是以级联卷积神经网络MTCNN为基础进行优化的结构,该神经网络包含三个子网络,分别称之为P-Net,R-Net,O-Net,三个网络组成一个级联结构。
8.根据权利要求6或7所述的一种实时视频流对象跟踪系统,其特征在于:所述P-Net由四层卷积组成...
【专利技术属性】
技术研发人员:羊爱英,燕硕,梁劲,张亚斌,张泽,
申请(专利权)人:南京稻子菱机电设备有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。