【技术实现步骤摘要】
一种基于视频流的头部姿态方法及装置
[0001]本专利技术涉及计算机视觉
,特别是关于一种基于视频流的头部姿态方法及装置。
技术介绍
[0002]随着深度学习、人工智能技术的飞速发展,人们对信息数字化及智能化的程度的需求也越来越强烈,头部姿态估计作为人特征分析的一项,是人脸跟踪和姿态识别的交叉领域,具有极高的研究价值和意义。对于人类来讲,通过直接观察并得出人的头部姿态是一种常见的能力,但是,计算机是通过二维的平面图像来获取的三维空间信息,来预测出人体头部姿态是不那么容易的。通常获得头部在可分为以下几个步骤:人脸检测、人脸对齐、人脸关键点检测以及头部姿态估计,其中每个步骤都很重要,都决定着最终的结果。每个模块的精度越高,最终姿态估计的结果就越好。目前随着深度学习技术的发展日益成熟,但在学术上通常采用的模型参数量都很大,计算量大、推理速度慢。
[0003]在现有头部姿态算法中,人脸跟踪需要对视频中的每一帧图像都进行人脸检测,通过人脸检测得出人脸在图片中的位置,将人脸图片从原始图片裁剪出来再送入人脸轮廓关键点模型中, ...
【技术保护点】
【技术特征摘要】
1.一种基于视频流的头部姿态方法,其特征在于,包括以下步骤:S1.获取输入视频文件中包含人脸的当前待测帧的原始图像;S2.对所述原始图像中的人脸区域进行检测并截取,得到初始人脸图像;S3.将所述初始人脸图像输入超轻量人脸关键点模型,对所述初始人脸图像进行对齐处理,获得对齐人脸图像;S4.将所述对齐人脸图像送入人脸判断模型,判断所述对齐人脸图像中是否含有人脸,若是,则进行下一步骤,若否,则返回步骤S1;S5.将所述对齐人脸图像输入人脸关键点轮廓模型,对所述对齐人脸图像进行高清处理,获得高清人脸检测框的位置坐标以及头部姿态结果;S6.获取所述视频文件中相邻下一帧的原始图像,根据当前帧图像的所述高清人脸检测框的位置坐标,截取相邻下一帧图像的初始人脸图像;重复执行步骤S3
‑
S6,依次输出在后连续帧图像的高清人脸检测框以及头部姿态结果。2.根据权利要求1所述的一种基于视频流的头部姿态方法,其特征在于,所述步骤S2具体包括如下内容:S21.对所述原始图像进行检测,获取第一人脸检测框的位置坐标[l,t,r,b],其中,(l,t)为所述原始图像上所述第一人脸检测框左上角位置的横坐标和纵坐标,(r,b)为所述原始图像上所述第一人脸检测框右下角位置的横坐标和纵坐标;S22.将所述原始图像按比例放大得到放大图像,对所述放大图像中的人脸区域进行检测,获取第二人脸检测框的位置坐标[l
’
,t
’
,r
’
,b
’
],其中,(l
’
,t
’
)为所述放大图像上所述第二人脸检测框左上角位置的横坐标和纵坐标,(r
’
,b
’
)为所述放大图像上所述第二人脸检测框右下角位置的横坐标和纵坐标;S23.使用所述第二人脸检测框对所述放大图像中的人脸部分进行截取,得到初始人脸图像,所述初始人脸图像的高为b
’‑
t
’
,宽为r
’‑
l
’
。3.根据权利要求2所述的一种基于视频流的头部姿态方法,其特征在于,所述所述步骤S3具体包括如下内容:S31.将所述初始人脸图像输入超轻量人脸关键点模型,输出人脸的第一低精度人脸关键点坐标集合[x
′0,y
′0,x
′1,y
′1,
…
x
′
n
‑1,y
′
n
‑1],其中,n表示人脸关键点的总数,(x
′0,y
′0)表示第1个人脸关键点的横坐标和纵坐标,(x
′
n
‑1,y
′
n
‑1)表示第n个人脸关键点的横坐标和纵坐标;S32.通过所述第一低精度人脸关键点坐标集合中各个关键点的横坐标和纵坐标与所述原始图像上所述第二人脸检测框左上角位置的横坐标和纵坐标分别相加,获得人脸在所述原始图像上的第二低精度人脸关键点坐标集合[x
″0,y
″0,x
″1,y
″1,
…
x
″
n
‑1,y
″
n
‑1];S33.通...
【专利技术属性】
技术研发人员:吉祥,
申请(专利权)人:深圳市即构科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。