【技术实现步骤摘要】
基于神经网络的车辆和行人视频计数方法和装置
本申请涉及视频计数领域,特别是涉及一种基于神经网络的车辆和行人视频计数方法和装置。
技术介绍
通过数字视频计算行人的数量已经有一定的研究基础。传统的方法中有一些已经被认为是经典的,具有许多商业和学术应用。行人计数的算法大多来自工作场景中前景和背景的分割,通过进行轮廓分析或者blob检测阈值来确定前景物体。近年来随着深度学习的发展,深度学习由于其高性能的图像分类和目标检测以及庞大的计算能力,使得计算机视觉领域取得很多突破。特别地在2016年JosephRedmon等人提出YOLO算法,它展示了一种可以将分类和定位整合到一起的新思路,达到端到端的检测,并且将检测速度提升到每秒45帧,真正达到视频检测的要求,并于2017年和2018年提出了YOLOv2和YOLOv3。但是,经典的基于分离前景的方法存在一些问题,首先物体的阴影很难与物体本身分离,难以分辨,且该方法没有提供一种直接的分类方法检测对象,同时受场景光照和图像噪声的影响较大。大部分深度学习方法提高了在视频检测的过程 ...
【技术保护点】
1.一种基于神经网络的车辆或行人视频计数方法,包括:/n从视频中获取当前帧;/n采用YOLO算法将所述当前帧分割成多个矩形网格;/n在每个网格中检测中心点落在该网格中的目标物体;/n判断检测到的目标物体是否为已检测到的类别,如果否,则确认所述检测到的目标物体为一个新的类别;/n对所述检测到的目标物体进行特征提取和预测;/n如果预测出有目标物体为车辆或行人,则对上一帧和所述当前帧中提取的该目标物体的特征进行匹配和跟踪;/n通过检测所述当前帧中的该目标物体是否通过指定计数线,对车辆或行人进行计数。/n
【技术特征摘要】
1.一种基于神经网络的车辆或行人视频计数方法,包括:
从视频中获取当前帧;
采用YOLO算法将所述当前帧分割成多个矩形网格;
在每个网格中检测中心点落在该网格中的目标物体;
判断检测到的目标物体是否为已检测到的类别,如果否,则确认所述检测到的目标物体为一个新的类别;
对所述检测到的目标物体进行特征提取和预测;
如果预测出有目标物体为车辆或行人,则对上一帧和所述当前帧中提取的该目标物体的特征进行匹配和跟踪;
通过检测所述当前帧中的该目标物体是否通过指定计数线,对车辆或行人进行计数。
2.根据权利要求1所述的方法,其特征在于,在每个网格中检测中心点落在该网格中的目标物体,包括:
在每个网格中获取目标边框所围的区域,确定所述区域的中心点,检测所述中心点是否落在该网格中,如果是,则确定有目标物体落在该网格中。
3.根据权利要求1所述的方法,其特征在于,判断检测到的目标物体是否为已检测到的类别,包括:
如果当前的目标物体在多个网格中均检测到,则将所述目标物体所在的多个网格进行组合,再判断组合后的形状内的目标物体是否为检测到的类别。
4.根据权利要求1所述的方法,其特征在于,对所述检测到的目标物体进行特征提取和预测,包括:
使用有限元法,对所述检测到的目标物体提取特征,包括ROI-centroid的像素坐标、矩形的大小和YOLO预测的标签,根据所述提取的特征预测所述目标物体是否为车辆或行人。
5.根据权利要求1-4中任一项所述的方法,其特征在于,通过检测所述当前帧中的该目标物体是否通过指定计数线,对车辆或行人进行计数,包括:
使用所述当前帧中的该目标物体的坐标与指定计数线的叉乘,来判断所述目标物体是否通过指定计数线,对车辆或行人进行计数。
<...
【专利技术属性】
技术研发人员:彭浩,
申请(专利权)人:北京影谱科技股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。