The invention provides a device for helping the visually impaired people travel, including the depth image calculation unit, the point cloud building unit, the ground detection unit and the object segmentation unit, which are used to remove the ground and the following point clouds, and divide the point cloud based on the clustering method to obtain each image; the object tracking unit is used for each of the objects. The object is tracked, the size of the three bit space, the direction of motion, the motion track and the speed of motion are calculated. The object recognition unit is used for each object, the image region is projected, the RGB image is extracted, the object recognition is based on the RGB image, and the speech synthesis and output single element are used for the type, location and location of the object. Synthetic speech is synthesized in motion direction and speed, and synthetic speech is output to notify the visually impaired. It provides comprehensive information for visually impaired people's autonomous decision-making, effectively helps visually impaired people avoid obstacles and improves the safety of visually impaired people.
【技术实现步骤摘要】
一种帮助视障人士出行的装置
本专利技术总体上涉及使用视觉和语音技术来进行障碍物检测和跟踪的装置,更具体地涉及使用双目相机或者立体相机的彩色图和深度图来检测障碍物并进行语音提醒的装置。
技术介绍
人类70%的感知信息来自视觉;视障人士比正常人更需要和更渴望弥补和增强。视障人士渴望能够自由的出行。户外出行,静止和移动的障碍物随时可能遇到,它们离的多远、方位如何、速度如何?如何实时发现他们并通知是帮助视障人士出行的关键所在。目前,学术界和工业界在尝试多种方法来试图解决这一问题。2014年牛津大学的史蒂芬希克斯研究使用深度传感器加OLED视觉增强的方法,将深度图像转化为音场。2014年的BrainPort项目研究将图像信息转为电极阵列的点阵,由舌头感触来尝试使大脑形成视知觉。这两种方法均需要视障人士使用设备进行相当长一段时间的训练,来尝试使视障人士自己形成一种新的对空间的感知方法。目前看,实施难度大,效果也尚需要验证。2015年9月百度的Dulight依托“百度大脑”的图像识别、人脸识别、语音识别以及深度学习等相关核心技术,打造盲人的日常生活私人助理。其结合百度大数据分析能力和自然人机交互技术,帮助盲人“洞见”真实世界,其可以把相机看到的物体等告知盲人,但无法知道物体相对于盲人的状态(距离、运动状态、尺寸等),对室外出行帮助有限。2017年微软的SeeingAI应用发布,其采用单目眼镜+深度学习技术(手机应用)的方式,主要帮助盲人来对场景进行理解、以语音方式和盲人交互。其通过摄像头对准身边的人或物就能为盲人用语言解说,充当盲人的眼睛,可进行人脸识别,并可通过语音说 ...
【技术保护点】
1.一种帮助视障人士出行的装置,包括:深度图像计算单元,用于连接双目相机,并基于双目相机采集到的左右彩色图像,计算得到深度图像,同步输出彩色图像和深度图像;点云构建单元,用于基于彩色图像和深度图像,构建点云(x,y,z,r,g,b)信息,即每个点包含3维空间坐标信息和3维彩色信息;地面检测单元,基于点云的3维空间坐标信息(x,y,z)进行平面检测,输出位置最低且包含点数最多的平面作为参考地面;对象分割单元,用于去除地面及以下的点云,并基于聚类的方法进行点云分割,得到各个对象;对象跟踪单元,用于对各个对象进行跟踪,计算其在三位空间的尺寸、运动方向、运动轨迹和运动速度;对象识别单元,用于对于各个对象,投影得到图像区域,提取RGB图像,基于RGB图像来进行对象识别;语音合成及输出单元,用于将对象的类型、位置、运动方向和速度合成语音,输出合成语音来通知视障人士。
【技术特征摘要】
1.一种帮助视障人士出行的装置,包括:深度图像计算单元,用于连接双目相机,并基于双目相机采集到的左右彩色图像,计算得到深度图像,同步输出彩色图像和深度图像;点云构建单元,用于基于彩色图像和深度图像,构建点云(x,y,z,r,g,b)信息,即每个点包含3维空间坐标信息和3维彩色信息;地面检测单元,基于点云的3维空间坐标信息(x,y,z)进行平面检测,输出位置最低且包含点数最多的平面作为参考地面;对象分割单元,用于去除地面及以下的点云,并基于聚类的方法进行点云分割,得到各个对象;对象跟踪单元,用于对各个对象进行跟踪,计算其在三位空间的尺寸、运动方向、运动轨迹和运动速度;对象识别单元,用于对于各个对象,投影得到图像区域,提取RGB图像,基于RGB图像来进行对象识别;语音合成及输出单元,用于将对象的类型、位置、运动方向和速度合成语音,输出合成语音来通知视障人士。2.根据权利要求1的帮助视障人士出行的装置,其特征在于,所述深度计算单元,基于双目相机采集到的左右彩色图像,计算得到深度图像包括:输入左右相机标定的标定文件,其包括了两个相机各自的内参和畸变参数,以及相机的空间位置关系;基于标定文件进行左右相机图像的畸变矫正和对齐;采用校正后的左右图,基于匹配技术计算深度图像。3.根据权利要求1的帮助视障人士出行的装置,其特征在于,所述点云构建单元,用于基于彩色图像和深度图像,构建点云(x,y,z,r,g,b)信息,包括:获取彩色图像和深度图像,基于相机的投影逆变换得到3维空间的3D点云(x,y,z);获取每个点云在彩色图像中对应像素的(r,g,b)信息,得到6D点云信息(x,y,z,r,g,b)。4.根据权利要求1的帮助视障人士出行的装置,其特征在于,所述地面检测单元,基于点云的3维空间坐标信息(x,y,z)进行平面检测,输出位置最低且包含点数最多的平面作为参考地面,包括:得到3D点云(x,y,z),在3D点云中进行平面检测获得多个平面;统...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。