【技术实现步骤摘要】
视频目标跟踪的方法和装置
本专利技术涉及计算机
,特别是涉及一种视频目标跟踪的方法和装置。
技术介绍
目标跟踪技术随着计算机技术的发展已经日臻完善和成熟,一直以来都是计算机视觉、图像处理领域的热点,被广泛应用在智能监控、智能交通、视觉导航、人机交互、国防侦察等领域。传统的目标跟踪算法通常使用一种或数种简单的传统特征匹配算法来区分目标,如利用图像本身的颜色、形状特征等,对目标人物的遮盖、转向、光照比较敏感,在人体目标跟踪场景下表现不佳。
技术实现思路
基于此,有必要针对上述技术问题,提供一种视频目标跟踪的方法和装置,提高跟踪的连续性和鲁棒性。一种视频目标跟踪的方法,所述方法包括:获取视频流,根据人脸检测算法识别人脸区域,得到第一视频帧对应的第一待跟踪目标;对所述第一待跟踪目标通过基于深度神经网络的人脸特征提取得到第一人脸特征加入特征库;在当前视频帧根据人脸检测算法识别人脸区域,得到当前视频帧对应的当前待跟踪目标,对所述当前待跟踪目标通过基于深度神经网络的人脸特征提取得到第二人脸特征,根据所述第二人脸特征和所述特征库将所述当前待跟踪目标与第一待跟踪目标进行特征匹配,以从所述第一视频帧开始跟踪所述第一待跟踪目标,在跟踪过程中根据提取的更新的人脸特征更新所述特征库。一种视频目标跟踪的装置,所述装置包括:检测模块,用于获取视频流,根据人脸检测算法识别人脸区域,得到第一视频帧对应的第一待跟踪目标;人脸特征提取模块,用于对所述第一待跟踪目标通过基于深度神经网络的人脸特征提取得到第一人脸特征加入特征库;所述检测模块还用于在当前视频帧根据人脸检测算法识别人脸区域,得到当前 ...
【技术保护点】
一种视频目标跟踪的方法,所述方法包括:获取视频流,根据人脸检测算法识别人脸区域,得到第一视频帧对应的第一待跟踪目标;对所述第一待跟踪目标通过基于深度神经网络的人脸特征提取得到第一人脸特征加入特征库;在当前视频帧根据人脸检测算法识别人脸区域,得到当前视频帧对应的当前待跟踪目标,对所述当前待跟踪目标通过基于深度神经网络的人脸特征提取得到第二人脸特征,根据所述第二人脸特征和所述特征库将所述当前待跟踪目标与第一待跟踪目标进行特征匹配,以从所述第一视频帧开始跟踪所述第一待跟踪目标,在跟踪过程中根据提取的更新的人脸特征更新所述特征库。
【技术特征摘要】
1.一种视频目标跟踪的方法,所述方法包括:获取视频流,根据人脸检测算法识别人脸区域,得到第一视频帧对应的第一待跟踪目标;对所述第一待跟踪目标通过基于深度神经网络的人脸特征提取得到第一人脸特征加入特征库;在当前视频帧根据人脸检测算法识别人脸区域,得到当前视频帧对应的当前待跟踪目标,对所述当前待跟踪目标通过基于深度神经网络的人脸特征提取得到第二人脸特征,根据所述第二人脸特征和所述特征库将所述当前待跟踪目标与第一待跟踪目标进行特征匹配,以从所述第一视频帧开始跟踪所述第一待跟踪目标,在跟踪过程中根据提取的更新的人脸特征更新所述特征库。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述第一待跟踪目标的人脸状态通过人脸识别算法识别得到对应的人脸身份信息,根据图像特征提取算法得到所述人脸身份信息对应的目标特征;所述在当前视频帧根据人脸检测算法识别人脸区域,得到当前视频帧对应的当前待跟踪目标的步骤包括:判断当前视频帧根据人脸检测算法是否识别到人脸区域,如果没有识别到人脸区域,则根据图像特征提取算法获取当前帧对应的当前图像特征;将所述当前图像特征与所述目标特征对比得到匹配的目标人脸身份信息;根据所述目标人脸身份信息得到当前视频帧对应的当前待跟踪目标。3.根据权利要求1所述的方法,其特征在于,所述对所述第一待跟踪目标通过基于深度神经网络的人脸特征提取得到第一人脸特征加入特征库的步骤包括:获取第一待跟踪目标对应的第一人脸身份信息;建立所述第一人脸身份信息对应的第一人脸特征集合,将所述第一人脸特征加入所述第一人脸特征集合并存储至特征库;所述在跟踪过程中根据提取的更新的人脸特征更新所述特征库的步骤包括:获取当前待跟踪目标对应的当前人脸身份信息;从所述特征库获取所述当前人脸身份信息对应的第一人脸特征集合;计算所述第一人脸特征集合中的人脸特征与所述第二人脸特征的差异量,如果所述差异量超过预设阈值,则在所述第一人脸特征集合中增加所述第二人脸特征。4.根据权利要求1所述的方法,其特征在于,所述在当前视频帧根据人脸检测算法识别人脸区域,得到当前视频帧对应的当前待跟踪目标的步骤包括:基于归一化的像素差异特征和人体半身识别算法识别人脸区域,得到当前视频帧对应的当前待跟踪目标。5.根据权利要求1所述的方法,其特征在于,所述在当前视频帧根据人脸检测算法识别人脸区域,得到当前视频帧对应的当前待跟踪目标的步骤包括:基于归一化的像素差异特征识别人脸区域,在当前视频帧得到第一推荐区域;根据光流分析算法计算得到所述第一待跟踪目标在当前视频帧对应的第二推荐区域;根据所述第一推荐区域和所述第二推荐区域得到所述当前待跟踪目标。6.根据权利要求5所述的方法,其特征在于,所述根据所述第一推荐区域和所述第二推荐区域得到所述当前待跟踪目标的步骤包括:根据帧间相关性进行运动预测得到预期运动范围,根据所述预期运动范围筛选所述第一推荐区域和所述第二推荐区域得到所述当前待跟踪目标。7.根据权利要求1至6任一项所述的方法,其特征在于,所述深度神经网络的网络结构为11层网络层,包括堆栈式的卷积神积网络和完全连接层,所述堆栈式的卷积神积网络由多个卷积层和maxpol层组成,具体网络结构为:conv3-64*2+LRN+maxpoolconv3-128+maxpoolconv3-256*2+maxpoolconv3-512*2+maxpoolconv3-512*2+maxpoolFC2048FC1024,其中con3表示半径为3的卷积层,LRN表示LRN层,maxpool表示maxpool层,FC表示完全连接层。8.根据权利要求1至6任一项所述的方法,其特征在于,所述对所述第一待跟踪目标通过基于深度神经网络的人脸特征提取得到第一人脸特征加入特征库的步骤包括:对所述第一待跟踪目标通过深度神经网络进行人脸特征提取得到第一特征矢量;所述对所述当前待跟踪目标通过基于深度神经网络的人脸特征提取得到第二人脸特征,根据所述第二人脸特征和所述特征库将所述当前待跟踪目标与第一待跟踪目标进行特征匹配,以从所述第一视频帧开始跟踪所...
【专利技术属性】
技术研发人员:余三思,
申请(专利权)人:腾讯科技上海有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。