一种机器人语音定位过程的摄像头角度校准方法技术

技术编号:13775012 阅读:72 留言:0更新日期:2016-09-30 19:23
本发明专利技术公开了一种机器人语音定位过程的摄像头角度校准方法,包括以下步骤:第一步,语音粗定位:根据语音信息将摄像头转到大致的语音源方位;第二步,人脸检测:利用摄像头检测是否有人脸,若摄像头检测到人脸则进行第三步;第三步,人脸角度偏差计算:以摄像头中心点为原点建立矩形坐标轴,并定位出人脸的中心坐标[X,Y],该坐标[X,Y]也为人脸中心与摄像头中心的偏差;第四步:角度调整:根据人脸坐标与摄像头中心点偏差换算出摄像头沿X轴旋转的角度degreeX和沿Y轴旋转的角度degreeY,然后根据degreeX和degreeY旋转摄像头使人脸的中心点对准摄像头的中心点。本发明专利技术提高了语音定位过程的摄像头对准精度。本发明专利技术提高了语音定位过程的摄像头对准精度。

【技术实现步骤摘要】

本专利技术涉及语音定位
,特别是一种机器人语音定位过程的摄像头角度校准方法
技术介绍
随着电子计算机科学的不断发展,智能机器人的研究越发深入,其携带的功能也越来越多,具有视觉、听觉、嗅觉等功能的高度智能化机器人已经出现,这种机器人均具有一套识别系统,通过该识别系统采集信息,经过处理器及其携带的处理系统所采集的信息获取识别结果,常见的如人脸识别系统,利用摄像头采集人脸图像,处理后即能识别出人的身份,但对于高度智能化的机器人来说仅通过一套人脸识别系统实现一系列复杂操作是不够的,例如能够与人交互的机器人,其还携带了360°的语音定位功能,用户呼叫机器人,机器人根据语音信息判断用户所处大致方位,再调转其摄像头的方向对准人脸进行图像采集和识别,这种技术能够实现360°无差别的定位跟踪,可以说更多技术的结合让机器人的智能化程度逐步提升。但是,目前机器人的语音定位技术还存在偏差,在上述的语音定位过程中,语音信息只能提供给机器人一个大致的方位,转动摄像头(即转动机器人头部)后很难精确找到人脸的中心位置,可能导致摄像头获取图像不够清晰,存在识别误差的可能,在操作上只能通过用户自己去寻找与摄像头对准的点,因此机器人的语音定位技术有待改进。
技术实现思路
本专利技术为解决上述问题,提供了一种机器人语音定位过程的摄像头角度校准方法,其提高了语音定位过程的摄像头对准精度。为实现上述目的,本专利技术采用的技术方案为:一种机器人语音定位过程的摄像头角度校准方法,包括以下步骤:第一步,语音粗定位:机器人采集到声波后,通过语音定位模块定位出语音源位置,根据该语音源位置信息将带有摄像头的机器人面部转到大致的语音源方位;第二步,人脸检测:利用机器人面部的摄像头采集图像,通过人脸检测模块判断所采集的图像中是否有人脸,若存在人脸则进行第三步;第三步,人脸角度偏差计算:采集一张人脸图像,检测出人脸中心位置,以摄像头中心点为原点建立矩形坐标轴,根据人脸中心位置和矩形坐标轴定位出图像中人脸的中心坐标[X,Y],该坐标[X,Y]也为人脸中心与摄像头中心的偏差;第四步:角度调整:根据人脸坐标与摄像头中心点偏差换算出摄像头沿X轴旋转的角度degreeX和沿Y轴旋转的角度degreeY,然后根据degreeX和degreeY值微调摄像头,使人脸的中心点对准摄像头的中心点,实现语音的精确定位。所述第三步与第四步之间还包括步骤:将计算出的偏差与预设偏差标准值比较,若偏差小于预设偏差标准值则执行第四步,该预设偏差标准值根据摄像头参数预先设置。所述第二步中的矩形坐标中,原点位于矩形的几何中心,所述第三步中degreeX和degreeY的计算公式如下:degreeX = x / (width/2) * MAX_DEGREE_X / 2;degreeY = y / (height/2) * MAX_DEGREE_Y / 2;其中,width为矩形沿X方向的长度,height为矩形沿Y轴方向的长度,MAX_DEGREE_X为摄像头沿X方向的最大广角,MAX_DEGREE_Y 为摄像头沿Y方向的最大广角。所述MAX_DEGREE_X为80°,MAX_DEGREE_Y 为40°。本专利技术的有益效果是:本专利技术的一种机器人语音定位过程的摄像头角度校准方法,通过在语音大致定位后,根据摄像头采集的图像中人脸图像与摄像头中心点在所采集的图像中的位置,计算出摄像头需要微调的旋转角度值,根据该旋转角度值机器人的面部方向,使机器人面部的摄像头对准人脸,针对机器人之前的语音粗定位进行微调,实现语音的精确定位,不仅提高了机器人与人声交互过程的拾音效果,提高语音识别的准确度,而且,机器人都能采集到交互对象人脸的正面图像,提高了用户体验。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本专利技术的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1为本专利技术的流程框图。具体实施方式为了使本专利技术所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图及实施例对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。如图1所示,本专利技术揭示的一种机器人语音定位过程的摄像头角度校准方法,其包括以下步骤:第一步,语音粗定位:机器人采集到声波后,通过语音定位模块定位出语音源位置,根据该语音源位置信息将带有摄像头的机器人面部转到大致的语音源方位;第二步,人脸检测:利用机器人面部的摄像头采集图像,通过人脸检测模块判断所采集的图像中是否有人脸,若存在人脸则进行第三步;第三步,人脸角度偏差计算:采集一张人脸图像,检测出人脸中心位置,以摄像头中心点为原点建立矩形坐标轴,根据人脸中心位置和矩形坐标轴定位出图像中人脸的中心坐标[X,Y],该坐标[X,Y]也为人脸中心与摄像头中心的偏差;第四步:角度调整:根据人脸坐标与摄像头中心点偏差换算出摄像头沿X轴旋转的角度degreeX和沿Y轴旋转的角度degreeY,然后根据degreeX和degreeY值微调摄像头,使人脸的中心点对准摄像头的中心点,实现语音的精确定位。所述第三步与第四步之间还包括步骤:将计算出的偏差与预设偏差标准值比较,若偏差小于预设偏差标准值则执行第四步,该预设偏差标准值根据摄像头参数预先设置。所述第二步中的矩形坐标中,原点位于矩形的几何中心,所述第三步中degreeX和degreeY的计算公式如下:degreeX = x / (width/2) * MAX_DEGREE_X / 2;degreeY = y / (height/2) * MAX_DEGREE_Y / 2;其中,width为矩形沿X方向的长度,height为矩形沿Y轴方向的长度,MAX_DEGREE_X为摄像头沿X方向的最大广角,MAX_DEGREE_Y 为摄像头沿Y方向的最大广角。所述MAX_DEGREE_X为80°,MAX_DEGREE_Y 为40°。本专利技术的一种机器人语音定位过程的摄像头角度校准方法,通过在语音大致定位后,根据摄像头采集的图像中人脸图像与摄像头中心点在所采集的图像中的位置,计算出摄像头需要微调的旋转角度值,根据该旋转角度值机器人的面部方向,使机器人面部的摄像头对准人脸,针对机器人之前的语音粗定位进行微调,实现语音的精确定位,不仅提高了机器人与人声交互过程的拾音效果,提高语音识别的准确度,而且,机器人都能采集到交互对象人脸的正面图像,提高了用户体验。上述说明示出并描述了本专利技术的优选实施例,应当理解本专利技术并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文专利技术构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本专利技术的精神和范围,则都应在本专利技术所附权利要求的保护范围内。本文档来自技高网...

【技术保护点】
一种机器人语音定位过程的摄像头角度校准方法,其特征在于,包括以下步骤:第一步,语音粗定位:机器人采集到声波后,通过语音定位模块定位出语音源位置,根据该语音源位置信息将带有摄像头的机器人面部转到大致的语音源方位;第二步,人脸检测:利用机器人面部的摄像头采集图像,通过人脸检测模块判断所采集的图像中是否有人脸,若存在人脸则进行第三步;第三步,人脸角度偏差计算:采集一张人脸图像,检测出人脸中心位置,以摄像头中心点为原点建立矩形坐标轴,根据人脸中心位置和矩形坐标轴定位出图像中人脸的中心坐标[X,Y],该坐标[X,Y]也为人脸中心与摄像头中心的偏差;第四步:角度调整:根据人脸坐标与摄像头中心点偏差换算出摄像头沿X轴旋转的角度degreeX和沿Y轴旋转的角度degreeY,然后根据degreeX和degreeY值微调摄像头,使人脸的中心点对准摄像头的中心点,实现语音的精确定位。

【技术特征摘要】
1.一种机器人语音定位过程的摄像头角度校准方法,其特征在于,包括以下步骤:第一步,语音粗定位:机器人采集到声波后,通过语音定位模块定位出语音源位置,根据该语音源位置信息将带有摄像头的机器人面部转到大致的语音源方位;第二步,人脸检测:利用机器人面部的摄像头采集图像,通过人脸检测模块判断所采集的图像中是否有人脸,若存在人脸则进行第三步;第三步,人脸角度偏差计算:采集一张人脸图像,检测出人脸中心位置,以摄像头中心点为原点建立矩形坐标轴,根据人脸中心位置和矩形坐标轴定位出图像中人脸的中心坐标[X,Y],该坐标[X,Y]也为人脸中心与摄像头中心的偏差;第四步:角度调整:根据人脸坐标与摄像头中心点偏差换算出摄像头沿X轴旋转的角度degreeX和沿Y轴旋转的角度degreeY,然后根据degreeX和degreeY值微调摄像头,使人脸的中心点对准摄像头的中心点,实现语音的精确定位。2.如权利要求1所述的一种机器人语音定位过程的摄像头角度校准方法,其特征在于...

【专利技术属性】
技术研发人员:沈崇禧伍本强刘福权
申请(专利权)人:南靖万利达科技有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1