The invention discloses an auxiliary RGB D camera and face recognition method based on the visually impaired. The method includes: using face color image and the depth image acquired by D RGB tracking, and automatically give these face labels; the labels from the user input through a microphone, including but not limited to face the name, phone number and other personal information, people are positive; face image correction, can adapt to the identification different postures; the face image after correction were used for training the neural network model in face recognition; facial image to be identified is input into the trained model of face recognition, recognition of the output of the model through the 3D stereo transferred to the user; the 3D stereo can prompt information includes: the azimuth and distance of face in face users in depth image distance.
【技术实现步骤摘要】
一种基于RGB-D相机和人脸识别的视障人士辅助方法
本专利技术涉及模式分类,机器学习,人脸识别,视觉障碍人群辅助
,尤其涉及一种基于RGB-D相机和人脸识别的视障人士辅助方法。
技术介绍
根据世界卫生组织(WHO)的数据,全球有2.85亿视障人士,其中有3900万是盲人。视障人士的日常生活中,识别周围人的身份是突出的需求。在没有其他设备的辅助下,视障人士只能通过辨别声音来判断,这在很大程度上受限于视障人士与其周围人的熟悉程度,距离,环境嘈杂度等因素。传统的人脸识别方法,一般采用彩色相机拍摄人脸图像,并且需要保证正面的人脸和均匀的光照,这就要求采集人脸样本的过程中,人脸尽量靠近相机并且正面面向相机。因此,设计一种专门面向视障人士的人脸识别系统,并使用简单自然的交互方式,将在很大程度上为视障人士提供方便。
技术实现思路
本专利技术的目的是利用RGB-D相机和人脸识别技术,解决视障人士的认人和识人方面存在的不便利性,旨在为视障人士提供一种简单易用,交互方式人性化的辅助方法。本专利技术通过以下技术方案来实现:一种基于RGB-D相机和人脸识别的视障人士辅助方法,具体步骤如下:(1)人脸的录入和人脸数据库的建立;(2)人脸图像的矫正;(3)神经网络训练;(4)识别人脸;(5)3D立体声用于识别结果的交互。所述步骤(1)具体为:针对每一个识别对象,分别采集多帧连续的彩色图像和深度图像,进一步通过RGB-D中的彩色图像通道检出人脸图像,以第一帧中检出的人脸图像作为人脸跟踪的初始化起点。若在第n帧中出现人脸漏检或检测错误,则可以启动人脸跟踪模式,检出人脸的区域。录入所有识 ...
【技术保护点】
一种基于RGB‑D相机和人脸识别的视障人士辅助方法,其特征在于,具体步骤如下:(1)人脸的录入和人脸数据库的建立;(2)人脸图像的矫正;(3)神经网络训练;(4)识别人脸;(5)3D立体声用于识别结果的交互。
【技术特征摘要】
1.一种基于RGB-D相机和人脸识别的视障人士辅助方法,其特征在于,具体步骤如下:(1)人脸的录入和人脸数据库的建立;(2)人脸图像的矫正;(3)神经网络训练;(4)识别人脸;(5)3D立体声用于识别结果的交互。2.根据权利要求1所述的方法,其特征在于,所述步骤(1)具体为:针对每一个识别对象,分别采集多帧连续的彩色图像和深度图像,进一步通过RGB-D中的彩色图像通道检出人脸图像,以第一帧中检出的人脸图像作为人脸跟踪的初始化起点。若在第n帧中出现人脸漏检或检测错误,则可以启动人脸跟踪模式,检出人脸的区域。录入所有识别对象的人脸图像数据和对应的姓名,建立人脸数据库。所述人脸跟踪模式包括以下步骤:第一,在第n-1帧的人脸检出情况下,分别计算彩色图和深度图中的人脸区域的直方图。彩色直方图的横坐标为色度值,纵坐标为每个色度值对应的像素的个数;深度直方图的横坐标为深度值,纵坐标为每个深度值对应的像素的个数。第二,在第n帧中,计算彩色图和深度图的返向投影图。彩色图对应的返向投影图是将彩色图中的每个像素点的色度值替换为彩色直方图中对应的纵坐标而获得;深度图对应的返向投影图是将深度图中的每个像素点的深度值替换为深度直方图中对应的纵坐标而获得。将两个返向投影图融合后,得到更符合实际情况的人脸区域预测。第三,在融合后的返向投影图中,应用均值漂移算法(MeanShift),计算出第n帧人脸的区域。3.根据权利要求1所述的方法,其特征在于,所述步骤(2)具体为:第一,调整人脸图像的格式为统一大小,即100像素*100像素。第二,检出人脸区域的特征点,所述特征点包括脸颊轮廓、眼睛、眉毛、鼻子、...
【专利技术属性】
技术研发人员:于红雷,赵向东,杨恺伦,胡伟健,汪凯巍,
申请(专利权)人:杭州视氪科技有限公司,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。