一种改良的视频人脸检测提升稳定性的方法技术

技术编号:21090761 阅读:38 留言:0更新日期:2019-05-11 10:23
一种改良的视频人脸检测提升稳定性的方法,包括以下步骤:(1)视频输入;(2)获取当前视频的帧率或者摄像头采集到视频的帧率;(3)以单帧为单位对视频进行分解,形成每一次输入均为1帧的数字图像矩阵;(4)输入1帧数字图像矩阵到人脸检测器中,计算后返回人脸检测的结果,并储存到ARRAY中;(5)使用简单的数学运算对视频中的人脸检测进行上下帧之间的结果关联计算;多个人脸相近框进行权重偏移计算,与当前帧人脸框取平均值;(6)将当前帧人脸检测的结果和经过计算后的人脸位置标注框追加到该数组中;(7)输入下一帧图像矩阵,从步骤5开始执行该流程直到视频帧处理结束。本发明专利技术算法简单、检测速率高、适用性广的优点。

【技术实现步骤摘要】
一种改良的视频人脸检测提升稳定性的方法
本专利技术涉及视频人脸检测
,具体涉及一种改良的视频人脸检测提升稳定性的方法。
技术介绍
人脸检测、人脸识别在近20年来得到了前所未有的发展,通过哈儿特征、积分图进行的人脸检测,通过颜色模板匹配进行的人脸检测到目前流行的利用神经网络结构进行的人脸检测,其准确性和稳定性正在逐步的提升。视频人脸检测作为一个流行的课题,越来越多的场景需要使用到该技术。如数字化的监控系统、智能移动化设备中的自拍系统、活体识别系统等。而在大部分的视频人脸检测中确保输出的人脸位置的稳定性是具有重大意义的。在连续的10个视频帧中,输入人脸基本保持位置不变的情况下,得到的人脸位置信息也应该基本保持不变。但是由于目前数字摄像头采集的视频帧中无可避免的存在电子信号的干扰、环境光线的干扰、感光元件的质量差异等等因素,在每一帧的输入视频中几乎无法保证图像的像素是一致的,也因为此,人脸检测器通过计算得到的人脸位置信息往往也是不一致的,会产生上下左右之间的偏移或者偏差。为了确保人脸检测的稳定性,通常做法是在编写或者训练检测器的时候对输入的数据进行各种情况的模拟,如神经网络的训练中,本文档来自技高网...

【技术保护点】
1.一种改良的视频人脸检测提升稳定性的方法,其特征在于,包括如下步骤:(1)直接输入包含多帧的视频文件,或者通过硬件设备摄像头采集实时的视频作为输入,要求输入的视频必须是有效的并且每一帧的视频图像矩阵的数据类型和大小尺寸保持一致;(2)获取当前视频的帧率或者摄像头采集到视频的帧率;定义一个数组容器ARRAY来存储一定数量T的人脸检测结果;(3)以单帧为单位对视频进行分解,形成每一次输入均为1帧的数字图像矩阵;(4)输入1帧数字图像矩阵到人脸检测器中,人脸检测器通过计算后返回人脸检测的结果,获得当前输入帧的人脸位置信息,并储存到ARRAY中;(5)a.取出ARRAY中已经储存的所有人脸检测结果,...

【技术特征摘要】
1.一种改良的视频人脸检测提升稳定性的方法,其特征在于,包括如下步骤:(1)直接输入包含多帧的视频文件,或者通过硬件设备摄像头采集实时的视频作为输入,要求输入的视频必须是有效的并且每一帧的视频图像矩阵的数据类型和大小尺寸保持一致;(2)获取当前视频的帧率或者摄像头采集到视频的帧率;定义一个数组容器ARRAY来存储一定数量T的人脸检测结果;(3)以单帧为单位对视频进行分解,形成每一次输入均为1帧的数字图像矩阵;(4)输入1帧数字图像矩阵到人脸检测器中,人脸检测器通过计算后返回人脸检测的结果,获得当前输入帧的人脸位置信息,并储存到ARRAY中;(5)a.取出ARRAY中已经储存的所有人脸检测结果,并开始循环;b.循环计算ARRAY中每一个人的人脸位置标注框与当前帧的人脸位置标注框Rect的相交面积占两框相并面积的比例(IOU),并记录每一个IOU的值;c.定义一个IOU的阈值T1,取b子步骤中所有IOU的值大于T1的人脸位置标注框作为符合条件的人脸位置标注框;d.根据符合条件的人脸位置标注框的中心点计算与当前帧人脸位置标注框中心点的欧几里得距离;e.根据每一个符合条件的人脸位置标注框信息计算偏移值;f.以每一个符合条件的人脸位置标注框中心点为基准,偏移到新的中心点;g.得到一系列符合条件的偏移后的人脸位置标注框,对其和当前人脸位置标注框取平均值;h.经过g子步骤后得到最终输出人脸位置标注框的中心位置,根据中心位置组合得到最终的输出人脸位置标注框;(6)经过步骤(5)后得到了当前帧的最终输出人脸检测结果,同时删除ARRAY中前两个元素,将当前帧人脸检测的结果(Rect)和经过计算后的人脸位置标注框追加到该数组中;(7)输入下一帧图像矩阵,从步骤5开始执行该流程直到视频帧处理结束。2.根据权利要求1所述的一种改良的视频人脸检测提升稳定性的方法,其特征在于:步骤(2)中所述帧率通过调用相关API进行返回,记录该帧率使用FPS表示,如果系统无法获取到FPS或者获取出错,则使用默认的帧率值,并使T的取值为T=FPS。3.根据权利要求1所述的一种改良的视频人脸检测提升稳定性的方法,其特征在于:步骤(1)将视频统一转换为人脸检测器支持的数字图像矩阵格式,或者在或步骤(3)中将不同的数字图像矩阵格式转化为人脸检测器支持的数字图像矩阵格式。4.根据权利要求2所述的一种改良的视频人脸检测提升稳定性的方法,其特征在于:步骤(4)中人脸检测的结果以数组方式进行保存,数组的长度是检测到的人脸数量大小;其中每张人脸信息自定义储存内容如下:X1:人脸位置标注框的左上角横轴坐标;Y1:人脸位置标注框的左上角纵轴坐标;Width:人脸位置标注框的宽度值;Height:人脸位置标注框的高度值;XCenter:人脸位置标注框的中心点横轴坐标;YCenter:人脸位置标注框的中心点纵轴坐标;其中,左上角对应的是显示设备当前的坐标系中的原点位置...

【专利技术属性】
技术研发人员:容李庆袁亚荣黄东生
申请(专利权)人:广州二元科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1