【技术实现步骤摘要】
人体头部定位方法、装置和存储介质
[0001]本公开涉及图像处理技术,具体而言,涉及一种用于人机交互的人体头部定位方法
、
装置和计算机可读存储介质
。
技术介绍
[0002]为了实现虚拟形象与不特定对象
(
例如,路人
)
之间的眼神
、
手势
、
语言等深度交互,需要识别交互对象并且获得交互对象的位置信息
。
在识别过程中,交互对象可能离开屏幕再返回,此时系统会将其识别为新用户,不能继续之前的沟通内容
。
在多人场景下,因为每个人姿势
、
角度
、
距离屏幕远近等影响,可能无法准确判断交互对象,也就无法准确地进行智能交互
。
[0003]在获得交互对象的位置信息过程中,当前可以采用双目或多目摄像头同时检测,以此来计算得到目标的三维信息
。
但该方法的成本较高,首先,多个摄像头的时间同步难以控制,且计算量庞大,难以以每秒
30 >帧的帧率实时检测;本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.
一种用于人机交互的人体头部定位方法,其特征在于包括:检测人体头部在图像中的像素坐标;根据人体头部的像素坐标
、
占据的像素尺寸和人体头部的先验尺寸估算人体头部与摄像头的距离;和根据预先确定的摄像头参数和估算的人体头部与摄像头的距离计算人体头部的空间点三维坐标
。2.
根据权利要求1所述的人体头部定位方法,其特征在于所述摄像头参数是摄像头的内参矩阵,所述人体头部距离摄像头的距离是人脸的中心点距离摄像头的中心的距离,人体头部的空间点三维坐标由人脸中心点相对于摄像头的主光轴在横向和纵向偏移的距离以及人脸的中心点距离摄像头的中心的距离来表示
。3.
根据权利要求1所述的人体头部定位方法,其特征在于检测人体头部在图像中的像素坐标包括使用目标检测算法检测人体头部,得到头部矩形框
。4.
根据权利要求1所述的人体头部定位方法,其特征在于还包括:使用训练的卷积神经网络模型提取当前的人脸特征向量;计算当前的人脸特征向量与存储的人脸特征向量的空间距离;和将计算的空间距离与预设的阈值进行比较来判断当前的人脸是否在之前出现过
。5.
根据权利要求4所述的人体头部定位方法,其特征在于还包括:如果根据计算的空间距离与所述预设的阈值进行比较判断当前的人脸没有出现过,将当前获取的声纹特征与存储的声纹特征进行比较;如果在存储的声纹特征中找到与其匹配的存储的声纹特征,则判断当前的人脸出现过,并根据所述存储的声纹特征和存储的人脸特征向量的对应关系调取对应的存储的人脸特征向量;和计算所述调取的存储的人脸特征向量与所述当前的人脸特征向量的空间距离,如果根据所述空间距离与所述预设的阈值的比较结果确定是同一个人,则将用所述当前的人脸特征向量和所述调取的存储的人脸特征向量求平均来替代所述调取的存储的人脸特征向量;如果根据所述空间距离与所...
【专利技术属性】
技术研发人员:李旭东,张玥,
申请(专利权)人:北京奥丁信息科技有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。