【技术实现步骤摘要】
一种人工智能跨相机多目标追踪系统及追踪算法
[0001]本专利技术属于视频监控与目标追踪
,具体涉及一种人工智能跨相机多目标追踪系统及使用其的追踪算法。
技术介绍
[0002]随着智能安防与智慧城市的发展,中国成为世界上监控设备部署规模最大的一个国家,而大量的视屏数据也带来了更多的机遇,基于监控视频流的各种应用不断得到拓展。
[0003]基于单相机的多目标追踪逐渐在速度和精度上取得了巨大的进步,在实际生活中也有广泛的应用,逐渐将原有事件发生后离线处理的形式转变为在线监测的形式,极大的节省了人力物力,对智慧城市的建设带来了更先进的技术。但生活中的场景往往不仅仅依赖于单相机,在现实诸多的公共场所中都布满了无死角的监控,每个人的行动轨迹都被尽收眼底,对于深度学习在跨相机场景的应用却少之又少,对于生活中更多的场景,往往需要通过对多个监控画面进行同时的处理才能够达到最佳的效果。多个监控画面的同步、实时视频画面的处理及跨相机场景多目标的关联都是巨大的难题。
[0004]通过以上分析,当前对跨相机多目标追踪问题的应用有着诸多难点,跨摄像头多目标跟踪的任务是找到行人在不同摄像头的所有运动轨迹,该任务的挑战性在于:处理多个视频的多个目标运算量大,以及实际应用中行人姿态、光照、相机视角变化等造成不同摄像头下的行人外观差异较大。
技术实现思路
[0005]本专利技术要解决的技术问题是提供一种人工智能跨相机多目标追踪系统及追踪算法,旨在解决现有单相机多目标追踪技术在视频监控中复杂场景应用的缺陷,从多个相 ...
【技术保护点】
【技术特征摘要】
1.一种人工智能跨相机多目标追踪系统,其特征在于,包括数据层模块、追踪层模块、检索层模块和表示层模块,其中,所述数据层模块负责不同视频数据流的采集、解析,对不同视频流数据流的处理以及后续的追踪均部署在不同的机器当中,将每台机器的CPU及显卡资源让一个功能充分使用,视频流的传输主要通过rtsp视频流实现,采用ffmpeg进行实时解码,降低推理周期中的整体延时,通过opencv实现对视频流数据的预处理;所述追踪层模块由目标检测、特征提取、模型预测、特征关联四个模块构成,目标检测模块对每个视频流中的行人进行检测并获得其对应的图片坐标系下的坐标;特征提取模块通过深度学习模型对检测到的目标框进行特征提取,得到每个目标2048维的向量特征,用于后续跨相机追踪部分的特征关联;模型预测模块通过卡尔曼滤波算法对目标的逐帧位置进行线性预测,降低因暂时性遮挡导致的追踪丢失的情况,通过对追踪目标的线性预测,实现短期丢失后目标复现仍然可以被检测到,同时采用IOU度量方式也可以实现更精准的IOU匹配;特征关联模块通过指定的度量距离,来计算不同目标之间的相似度或特征距离,然后通过匈牙利算法来对相邻帧的追踪目标和检测目标来进行关联匹配,从而实现单相机或多相机下的多目标追踪;所述检索层模块用于跨相机的扩展,包含目标特征采集、自动化特征更新、多维特征索引、持久化存储四个功能块,特征采集模块用于在实际追踪过程中对追踪目标信息的采集,包含目标的id与2048维的特征以及目标所对应的相机标识,检索库中每一个id会包含多个特征用于检索;自动化特征更新用在特征采集的过程中,通过同一id已经采集到的特征信息来进行取舍判断,根据相似度或特征距离的大小设定阈值来决定当前特征信息是否纳入到检索库当中,排除掉遮挡情况下特征提取效果不好的特征;多维特征索引用于通过id或相机标识来索引相应的特征信息;持久化存储用于该内存数据的保存,通过定期序列化特征检索库实现特征检索库的文件存储,将特征关联功能提取出来,从而实现更便捷与精准的关联匹配;所述表示层模块是为了跨相机追踪的可视化效果展示,包含相机平面映射和目标位置映射与渲染两个模块,通过相机平面映射,将不同相机的空间画面映射到2D俯视平面上的相应的多边形,方便在一张图中聚集与展示多个视频画面,使得实验结果有更加直观的展示,对于实验分析、后续实验设计及实验优化进行可视化,都有较大的帮助;目标位置映射与渲染用于将目标在原相机下的坐标映射到2d俯视平面中用于呈现,通过不同监控画面下相同目标在俯视平面上的映射情况来分析实验的效果。2.一种人工智能跨相机多目标追踪算法,其特征在于,包括如下步骤:S1、部署多台边缘计算设备和服务器机器,保证所有设备在同一个网段下,在边缘设备上完成实时监控视频流的采集、解析和处理;S2、每台边缘设备对相应的视频流进行目标检测与行人重识别操作,获取每一个行人的位置和行人提取到的高维特征;S3、边缘设备将统计得到的检测信息加上时间戳和视频流标识发送至服务器,服务器接收到发来的检测信息后,根据时间戳来实现检测信息的同步;S4、服务器根据视频流标识,对每一个视频画面进行内部的单相机多目标追踪,来对画面中的行人进行关联追踪,主要将画面中当前存在的追踪目标和检测目标进行匹配,通过
匈牙利算法实现两者间的最佳匹配;S5、对于步骤S4中未匹配上的检测目标,针对每一个视频流标识中的检测目标,将其与其他视频流标识对应的画面中的追踪目标进行关联,通过轮询的方式对画面中的检测目标所对应的行人特征序列来进行匹配,...
【专利技术属性】
技术研发人员:路松峰,刘永志,
申请(专利权)人:南京搜文信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。