一种基于深度智能交互的室外视障辅助方法技术

技术编号：34105164 阅读：42 留言：0更新日期：2022-07-12 00:18

本发明专利技术公开了一种基于深度智能交互的室外视障辅助方法，包括：1.获取图像和语音数据；2.根据图像数据获得深度图；3.基于目标检测网络获取目标信息；4.基于语义分割网络获取路面信息；5.将目标信息和道路信息映射到世界坐标系中；6.对目标和道路边缘实时检测并语音播报。本发明专利技术能快速准确的分析使用者前方的目标和道路边缘的位置及距离，并通过语音进行反馈，从而能保障视障人士的出行安全。从而能保障视障人士的出行安全。从而能保障视障人士的出行安全。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度智能交互的室外视障辅助方法

[0001]本专利技术属于多媒体信息处理领域，涉及到计算机视觉、自然语言处理、深度学习、双目测距等技术，具体地说是一种基于深度智能交互的室外视障辅助方法。

技术介绍

[0002]目前视障人士的出行安全和生活保障仍然是社会的一大热点。盲道，导盲犬等措施虽然可以在一定程度上满足视障群体的生活，但因其消耗资源多，成效不显著，终归不是治本之道。因此一种可供视障人士自己使用的，便捷有效的设备迫在眉睫，但是纵观国内外大学公布的研究课题，鲜有此方面的研究和成果出现。

技术实现思路

[0003]本专利技术为了解决上述现有技术存在的不足之处，提出一种基于深度智能交互的室外视障辅助方法，以其能快速准确的分析使用者前方的目标和道路边缘的位置及距离，从而能保障视障人士的出行安全。
[0004]本专利技术为解决技术问题采用如下的方法方案：
[0005]本专利技术一种基于深度智能交互的室外视障辅助方法的特点是按如下步骤进行：
[0006]步骤1、获取图像和语音数据：
[0007]步骤1.1、在使用者的前方配置有传感器装置，并包括：左右两侧的黑白相机、中间的彩色相机、麦克风和耳机；其中，黑白相机的水平、垂直视场角信息记为HFOV
Mono
,VFOV
Mono
，彩色相机的水平、垂直视场角信息为HFOV
Rgb
,VFOV
Rgb
；
[0008]步骤1.2、利用所述彩色相机获取使用者前方...

【技术保护点】

【技术特征摘要】
1.一种基于深度智能交互的室外视障辅助方法，其特征是按如下步骤进行：步骤1、获取图像和语音数据：步骤1.1、在使用者的前方配置有传感器装置，并包括：左右两侧的黑白相机、中间的彩色相机、麦克风和耳机；其中，黑白相机的水平、垂直视场角信息记为HFOV
Mono
，VFOV
Mono
，彩色相机的水平、垂直视场角信息为HFOV
Rgb
，VFOV
Rgb
；步骤1.2、利用所述彩色相机获取使用者前方的维度为3
×
W
rgb
×
H
rgb
的彩色场景图像img
rgb
；其中，W
rgb
表示彩色场景图像img
rgb
的宽度，H
rgb
表示彩色场景图像img
rgb
的高度；3表示通道数；步骤1.3、利用两个黑白相机分别获取使用者前方两侧的维度均为1
×
W
Mono
×
H
Mono
的左、右黑白场景图像img
l
，img
r
；其中，W
Mono
表示黑白场景图像的宽度，H
Mono
表示黑白场景图像的高度；步骤2、根据图像数据获得深度图：步骤2.1、对左、右黑白场景图像img
l
，img
r
分别进行校正得到校正后的左、右黑白场景图像步骤2.2、对校正后的左、右黑白场景图像按照从左到右、从上到下的顺序逐行扫描和匹配，从而得到左、右黑白场景图像中互相匹配的像素点对集合；令f
i
为第i组匹配的像素点对；步骤2.3、计算第i组匹配的像素点对f
i
中两个匹配的像素点之间的像素间距d
i
；步骤2.4、计算第i组的像素间距d
i
的视差值D
i
；步骤2.5、计算所述像素点对集合中所有组的像素点对的视差值，得到左侧黑白场景图像中每个像素点的深度信息，从而由每个像素点的深度信息构建成维度为1
×
W
Mono
×
H
Mono
的深度图img
depth
；步骤2.6、根据黑白相机与彩色相机的视场角、焦距和相机间的水平间距信息，对深度图img
depth
进行裁剪和平移，使得深度图img
depth
与彩色场景图像img
rgb
的像素点一一对应，从而生成与彩色场景图像img
rgb
维度匹配的裁剪后的深度图img
Rgb，depth
；其维度为1
×
W
rgb
×
H
rgb
步骤3、基于目标检测网络获取目标信息：步骤3.1、令目标检测网络对输入图像的维度要求记为其中，表示目标检测网络要求的输入图像的宽度，表示目标检测网络要求的输入图像的高度；步骤3.2、按照维度要求对彩色场景图像img
rgb
依次进行缩放、灰色像素填充、维度扩充和归一化处理，从而得到维度为的预处理后的彩色场景图像步骤3.3、所述处理后的彩色场景图像输入目标检测网络中进行处理，输出彩色场景图像中所有目标的类别、目标所在的检测框位置；步骤4、基于语义分割网络获取路面信息：
步骤...

【专利技术属性】
技术研发人员：郭丹，谷纪豪，唐申庚，肖同欢，曹晨曦，宋万强，
申请(专利权)人：合肥工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人