一种基于视觉注意特性的视-听觉转换导盲方法技术

技术编号：21251784 阅读：86 留言：0更新日期：2019-06-01 09:31

本发明专利技术公开了一种基于视觉注意特性的视‑听觉转换导盲方法，该方法利用人类对动静态物体的视觉注意特性对视频图像进行简化，并根据其重要性分别采用精度不同的听觉显示技术进行播放，可以在避免信息过载的同时，为使用者提供更多的环境信息。本发明专利技术在对视频图像简化的同时，还对行进路线上非注意区域的障碍物和运动物体进行检测，可以更好地保证使用者安全。本发明专利技术基于人类视觉的感知特性来处理视‑听觉转换，比现有技术更符合视觉的使用习惯，使用起来更方便和自然。

A Blind Guide Method Based on Visual Attention Characteristic for Visual-Audio Conversion

The invention discloses a visual-auditory conversion blind guide method based on visual attention characteristics. The method simplifies video images by using human visual attention characteristics of dynamic and static objects, and uses different precision auditory display technology according to their importance to play, which can avoid information overload and provide more environmental information for users. The invention not only simplifies the video image, but also detects obstacles and moving animals in the non-attention area on the route, so as to better ensure the safety of users. The present invention deals with visual-auditory conversion based on the perceptual characteristics of human vision, which is more in line with the use habit of vision and more convenient and natural than the prior art.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于视觉注意特性的视-听觉转换导盲方法
本专利技术涉及信号处理
，具体涉及一种基于视觉注意特性的视-听觉转换导盲方法。
技术介绍
人类获取的信息有80％来自视觉，视觉损伤将给人们的生活带来极大的不便。由于视觉信息的缺失，视力障碍者无法正常感知周围环境，自由行走受到阻碍，难以生活自理，给生存、生活、学习、就业、社交等方面带来巨大的困难，严重影响了其家庭的生活质量。据统计，90％左右的视觉障碍者为低收入人群。随着视力障碍者数量的不断增长，对可以引导盲人自主行走、感受周围环境信息且价格低廉的辅助工具的需求也越来越迫切。安全行走是盲人最迫切需要解决的问题，目前常见的导盲产品主要有白手杖(WhiteCane)、导盲犬、电子行走辅助装置(ElectronicTravelAids，ETA)等。白手杖上没有安装任何电子辅助设备，价格低廉，是最常用的一种导盲产品，但白手杖能给盲人提供的信息非常的有限，性能价值偏低，危险系数高，难以满足视觉障碍患者的实际需要。导盲犬在发达国家中较早得到推广和应用，但我国2006年开始才出现第一批导盲犬，且因为导盲犬的使用存在着训练周期和适应期过长、成本高昂、饲养出行不便及其他诸多不可控因素，所以目前还难以在我国广泛使用。与白手杖和导盲犬相比，电子行走辅助装置具有提供信息量大、功能多、价格适中、使用方便等诸多优点，是一种更适合大规模推广的导盲方案，因此受到越来越多研究者的关注，在实际中也有着广泛的应用前景。目前电子行走辅助装置主要可以分为智能导盲手杖、智能引导式穿戴、移动式多功能引导机器人等几种，通常采用超声、红外、激光、视频、多传感...

【技术保护点】
1.一种基于视觉注意特性的视‑听觉转换导盲方法，其特征在于，所述的视‑听觉转换导盲方法包括下列步骤：S1、从输入视频流中采集RGB彩色图像和深度图像，并基于RGBD图像，对前景物体和背景物体进行划分，其中，RGBD图像为RGB彩色图像和深度图像；S2、设置RGBD图像中的注视区域，标注出注视区域所覆盖的前景物体，并将其转换为第一音频信号；S3、根据采集的视频信号，将当前时间的RGBD图像与其前后数帧的RGBD图像作对比，检测并标注出RGBD图像中平均深度值最小的M个运动前景物体，然后将被标注的运动前景物体转换为第二音频信号，其中M为预设的常数；S4、从RGBD图像的非注视区域中提取前景物体，在提取的前景物体中标注出平均深度值最小的N个前景物体，然后将被标注的前景物体转换为第三音频信号，其中N为预设的常数；S5、将得到的第一音频信号、第二音频信号、第三音频信号按预设顺序对使用者播放。

【技术特征摘要】
1.一种基于视觉注意特性的视-听觉转换导盲方法，其特征在于，所述的视-听觉转换导盲方法包括下列步骤：S1、从输入视频流中采集RGB彩色图像和深度图像，并基于RGBD图像，对前景物体和背景物体进行划分，其中，RGBD图像为RGB彩色图像和深度图像；S2、设置RGBD图像中的注视区域，标注出注视区域所覆盖的前景物体，并将其转换为第一音频信号；S3、根据采集的视频信号，将当前时间的RGBD图像与其前后数帧的RGBD图像作对比，检测并标注出RGBD图像中平均深度值最小的M个运动前景物体，然后将被标注的运动前景物体转换为第二音频信号，其中M为预设的常数；S4、从RGBD图像的非注视区域中提取前景物体，在提取的前景物体中标注出平均深度值最小的N个前景物体，然后将被标注的前景物体转换为第三音频信号，其中N为预设的常数；S5、将得到的第一音频信号、第二音频信号、第三音频信号按预设顺序对使用者播放。2.根据权利要求1所述的一种基于视觉注意特性的视-听觉转换导盲方法，其特征在于，所述的步骤S1过程如下：S1.1、基于深度图像计算深度梯度图像和法向量梯度图像，基于RGB彩色图像计算彩色梯度图像；S1.2、对上述深度梯度图像、法向量梯度图像和彩色梯度图像的每幅图像进行处理，提取图像中所有极小值的深度，删除深度小于预先指定阈值的极小值点，只保留深度大于预先指定阈值的极小值点；S1.3、将步骤S1.2所得的三幅图像进行与操作，得到标记图像；S1.4、利用标记图像对彩色梯度图像进行修正，使彩色梯度图像只在标记处具有极小值，不在标记处的像素点不具有极小值；S1.5、在修正后的彩色梯度图像上进行分水岭分割；S1.6、根据深度图像判断步骤S1.5分割结果中物体遮挡关系，将被遮挡物体作为背景物体，未被遮挡的物体作为前景物体。3.根据权利要求1所述的一种基于视觉注意特性的视-听觉转换导盲方法，其特征在于，所述的步骤S2中注视区域所覆盖的任一前景物体采用以下方法转换为音频信号：S2.1A、将前景物体中每个像素点的坐标映射为声场的来波方向，深度值映射为声音强度，来波方向采用以下公式计算：其中φ和θ分别为来波方向的仰角和方向角，x和y为像素点对应的图像坐标，x0和y0分别为来波方向的仰角和方向角为0时对应的图像坐标，Θ和Ξ分别为摄像头视场仰角和方向角变化范围的大小，深度值采用下式映射为声音强度Nf＝10Alog10(4π(dmax-d)2+1)(3)其中Nf为映射后的声音强度，dmax为摄像头所能识别最大深度值，d为像素点的深度值，A为预设的增益；S2.2A、计算每个像素点所对应的来波方向的头部传输函数，将预设的激励音频放大至像素点对应的声音强度，用头部传输函数对其进行滤波，从而得到预设时长的双声道音频信号；S2.3A、按预设的顺序逐点计算上述前景物体的像素对应的双声道音频信号，直至所有像素计算完毕。4.根据权利要求1所述的一种基于视觉注意特性的视-听觉转换导盲方法，其特征在于，所述的步骤S2中注视区域所覆盖的任一前景物体采用以下方法转换为音频信号：S2.1B、预设所使用的几何图形集合，每个几何图形设定其对应的激励音频；S2.2B、将前景物体的轮廓用几何图形集合中几何图形的组合进行近似；S2.3B、按预设的顺序选择组成上述前景物体的一个几何图形，将其中心的图像坐标转换为声场的来波方向，平均...

【专利技术属性】
技术研发人员：张军，王凯炼，宁更新，冯义志，余华，季飞，王杰，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人