在视频中定位对象的方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:22974963 阅读:12 留言:0更新日期:2019-12-31 23:31
本发明专利技术属于人工智能领域,本发明专利技术实施例公开了一种在视频中定位对象的方法、装置、计算机设备及存储介质,其中方法包括下述步骤:获取待定位对象的第一图像特征,所述第一图像特征包含图像轮廓和\或图像颜色特征;根据所述待定位对象的第一图像特征检索预设的视频数据库,获取与所述待定位对象的第一图像特征匹配的候选对象的图像;获取待定位对象的人脸特征;将所述待定位对象的人脸特征与所述候选对象的图像比对,确定所述候选对象中与所述待定位对象的人脸特征匹配的对象为所述待定位对象。通过第一图像特征检索视频数据库,可以快速定位候选对象,再根据人脸特征定位待定位对象,很大程度地减少了计算量,提高了对象定位的时效性。

Methods, devices, computer equipment and storage media for locating objects in video

【技术实现步骤摘要】
在视频中定位对象的方法、装置、计算机设备及存储介质
本专利技术属于人工智能领域,尤其涉及一种在视频中定位对象的方法、装置、计算机设备及存储介质。
技术介绍
随着社会经济的发展,城镇化建设速度加快,导致城市中人口密度不断增加,社会人员流动性与日俱增,引发了城市建设中的交通、社会治安、重点区域防范防恐等新问题,社会管理难度不断增加。安防系统使用了大量的视频采集设备,通过视频实时监控,并记录视频数据以备查看,以便维护公共安全。分析视频监控设备采集的数据,对特定对象进行识别、定位及跟踪是公安机关经常的工作。然而庞大的视频数据巨大仅依靠人工进行对象分辨识别,耗时费力,且精度低。有些视频监控系统虽然引入了人脸识别技术对对象进行定位,但是人脸识别要求视频采集设备精度高,视频采集设备精度越高,产生的视频数据越大,且人脸识别计算过程复杂,因而在庞大的视频数据中检索出待定位对象的人脸,需要的计算时间较长或需要较多的计算资源,对一些计算资源有限但对时效性要求较高的场合往往不能满足检索要求。
技术实现思路
本专利技术提供一种在视频中定位对象的方法、装置、计算机设备及存储介质,以解决定位对象耗时的问题。为解决上述技术问题,本专利技术提出一种在视频中定位对象的方法,包括如下步骤:获取待定位对象的第一图像特征,所述第一图像特征包含图像轮廓和\或图像颜色特征;根据所述待定位对象的第一图像特征检索预设的视频数据库,获取与所述待定位对象的第一图像特征匹配的候选对象的图像;获取待定位对象的人脸特征;将所述待定位对象的人脸特征与所述候选对象的图像比对,确定所述候选对象中与所述待定位对象的人脸特征匹配的对象为所述待定位对象。可选地,在所述获取待定位对象的第一图像特征的步骤中,包括下述步骤:获取待定位对象的图像;根据图像轮廓特征提取算法和\或颜色特征提取算法对所述待定位对象的图像进行处理,获取所述待定位对象的第一图像特征。可选地,在所述获取所述待定位对象的人脸特征的步骤中,包括下述步骤:获取待定位对象的人脸图像;将所述待定位对象的人脸图像输入到预设的人脸特征提取模型中,获取所述待定位对象图像的人脸特征。可选地,在所述根据所述待定位对象的第一图像特征检索预设的视频数据库,获取与所述待定位对象的第一图像特征匹配的候选对象的图像的步骤中,包括下述步骤:获取视频图像帧,所述视频图像帧为所述预设的视频数据库中保存的视频的分解;将所述视频图像帧输入到预设的目标检测模型中,获取所述目标检测模型响应所述视频图像帧而输出的目标对象的图像,其中,所述预设的目标检测模型基于预先训练的深度学习神经网络,所述目标对象的图像为人体图像;将所述目标对象的图像根据图像轮廓特征提取算法和\或颜色特征提取算法,计算所述目标对象的第一图像特征;计算所述待定位对象的第一图像特征与所述目标对象的第一图像特征之间的匹配度,当所述匹配度大于预设的第一阈值时,确定所述目标对象为所述候选对象。可选地,在所述将所述待定位对象的人脸特征与所述候选对象的图像比对,确定所述候选对象中与所述待定位对象的人脸特征匹配的对象为所述待定位对象的步骤中,包括下述步骤:获取所述候选对象的人脸图像,所述候选对象的人脸图像截取自所述候选对象的图像;将所述候选对象的人脸图像输入到所述预设的人脸特征提取模型中,获取所述候选对象的人脸特征;计算所述待定位对象的人脸特征与所述候选对象的人脸特征之间的匹配度,当所述匹配度大于预设的第二阈值时,确定所述候选对象为所述待定位对象。可选地,所述预设的人脸特征提取模型基于预先训练的卷积神经网络模型,其中,所述卷积神经网络模型的训练包括下述步骤:获取标记有身份标识的训练样本,所述训练样本为标记有不同身份标识的人脸图像;将所述训练样本输入到卷积神经网络模型中,获取所述训练样本的身份标识预测结果;根据损失函数比对所述训练样本的身份标识预测结果与所述身份标识是否一致,其中,所述损失函数为:其中,N为训练样本数,针对第i个样本对应的yi是标记的结果,h=(h1,h2,...,hi)为样本i的预测结果;当所述身份标识预测结果与所述身份标识不一致时,反复循环迭代的更新所述卷积神经网络模型中的权重,至所述损失函数收敛时结束。可选地,所述图像轮廓特征提取算法采取图像梯度算法,梯度表示为:Gx=f(x,y)-f(x-1,y)Gy=f(x,y)-f(x,y-1)其中,f(x,y)为待计算轮廓的图像的图像函数,f(x,y)、f(x-1,y)与f(x,y-1)分别是图像函数f(x,y)在点(x,y)、点(x-1,y)与点(x,y-1)的梯度,Gx、Gy分别为图像函数f(x,y)在x方向和y方向的梯度。为解决上述技术问题,本专利技术实施例还提供一种在视频中定位对象的装置,包括:第一获取模块,用于获取待定位对象的第一图像特征,所述第一图像特征包含图像轮廓和\或图像颜色特征;检索模块,用于根据所述待定位对象的第一图像特征检索预设的视频数据库,获取与所述待定位对象的第一图像特征匹配的候选对象的图像;第二获取模块,用于获取待定位对象的人脸特征;处理模块,用于将所述待定位对象的人脸特征与所述候选对象的图像比对,确定所述候选对象中与所述待定位对象的人脸特征匹配的对象为所述待定位对象。可选地,在所述第一获取模块中,还包括:第一获取子模块,用于获取待定位对象的图像;第一处理子模块,用于根据图像轮廓特征提取算法和\或颜色特征提取算法对所述待定位对象的图像进行处理,获取所述待定位对象的第一图像特征。可选地,在所述第二获取模块中,还包括:第二获取子模块,用于获取待定位对象的人脸图像;第二处理子模块,用于将所述待定位对象的人脸图像输入到预设的人脸特征提取模型中,获取所述待定位对象图像的人脸特征。可选地,在所述检索模块中,还包括:第三获取子模块,用于获取视频图像帧,所述视频图像帧为所述预设的视频数据库中保存的视频的分解;第一检测子模块,用于将所述视频图像帧输入到预设的目标检测模型中,获取所述目标检测模型响应所述视频图像帧而输出的目标对象的图像,其中,所述预设的目标检测模型基于预先训练的深度学习神经网络,所述目标对象的图像为人体图像;第一计算子模块,用于根据图像轮廓特征提取算法和\或颜色特征提取算法对所述目标对象的图像进行处理,获取所述目标对象的第一图像特征;第三处理子模块,用于计算所述待定位对象的第一图像特征与所述目标对象的第一图像特征之间的匹配度,当所述匹配度大于预设的第一阈值时,确定所述目标对象为所述候选对象。可选地,在所述处理模块中,还包括:第四获取子模块,用于获取所述候选对象的人脸图像,所述候选对象的人脸图像截取自所述候选对象的图像;第二计算子模块,本文档来自技高网...

【技术保护点】
1.一种在视频中定位对象的方法,其特征在于,包括下述步骤:/n获取待定位对象的第一图像特征,所述第一图像特征包含图像轮廓和\或图像颜色特征;/n根据所述待定位对象的第一图像特征检索预设的视频数据库,获取与所述待定位对象的第一图像特征匹配的候选对象的图像;/n获取待定位对象的人脸特征;/n将所述待定位对象的人脸特征与所述候选对象的图像比对,确定所述候选对象中与所述待定位对象的人脸特征匹配的对象为所述待定位对象。/n

【技术特征摘要】
1.一种在视频中定位对象的方法,其特征在于,包括下述步骤:
获取待定位对象的第一图像特征,所述第一图像特征包含图像轮廓和\或图像颜色特征;
根据所述待定位对象的第一图像特征检索预设的视频数据库,获取与所述待定位对象的第一图像特征匹配的候选对象的图像;
获取待定位对象的人脸特征;
将所述待定位对象的人脸特征与所述候选对象的图像比对,确定所述候选对象中与所述待定位对象的人脸特征匹配的对象为所述待定位对象。


2.根据权利要求1所述的在视频中定位对象的方法,其特征在于,在所述获取待定位对象的第一图像特征的步骤中,包括下述步骤:
获取所述待定位对象的图像;
根据图像轮廓特征提取算法和\或颜色特征提取算法对所述待定位对象的图像进行处理,获取所述待定位对象的第一图像特征。


3.根据权利要求1所述的在视频中定位对象的方法,其特征在于,在所述获取所述待定位对象的人脸特征的步骤中,包括下述步骤:
获取所述待定位对象的人脸图像;
将所述待定位对象的人脸图像输入到预设的人脸特征提取模型中,获取所述待定位对象图像的人脸特征。


4.根据权利要求1所述的在视频中定位对象的方法,其特征在于,在所述根据所述待定位对象的第一图像特征检索预设的视频数据库,获取与所述待定位对象的第一图像特征匹配的候选对象的图像的步骤中,包括下述步骤:
获取视频图像帧,所述视频图像帧为所述预设的视频数据库中保存的视频的分解;
将所述视频图像帧输入到预设的目标检测模型中,获取所述目标检测模型响应所述视频图像帧而输出的目标对象的图像,其中,所述预设的目标检测模型基于预先训练的深度学习神经网络,所述目标对象的图像为人体图像;
将所述目标对象的图像根据图像轮廓特征提取算法和\或颜色特征提取算法,计算所述目标对象的第一图像特征;
计算所述待定位对象的第一图像特征与所述目标对象的第一图像特征之间的匹配度,当所述匹配度大于预设的第一阈值时,确定所述目标对象为所述候选对象。


5.根据权利要求3所述的在视频中定位对象的方法,其特征在于,在所述将所述待定位对象的人脸特征与所述候选对象的图像比对,确定所述候选对象中与所述待定位对象的人脸特征匹配的对象为所述待定位对象的步骤中,包括下述步骤:
获取所述候选对象的人脸图像,所述候选对象的人脸图像截取自所述候选对象的图像;
将所述候选对象的人脸图像输入到所述预设的人脸特征提取模型中,获取所述候选对象的人脸特征;
计算所述待定位对象的人脸特征与所述候...

【专利技术属性】
技术研发人员:张磊宋晨李雪冰
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1