The invention discloses a terrain and target detection method. In this method, a color camera collects images, uses a small processor to process the collected images, outputs the terrain or target type of each pixel in the image, obtains the semantically segmented image, and then determines the region where the terrain and target need to be detected through the semantically segmented image. This method can simultaneously detect terrain such as ground, sidewalk, staircase, water surface, pedestrian, vehicle and other targets. It has the advantages of high uniformity, high real-time, high indoor and outdoor adaptability, and does not need specific assumptions. It can well meet the travel requirements of visually impaired people.
【技术实现步骤摘要】
一种地形和目标检测方法
本专利技术属于模式识别技术、图像处理技术、计算机视觉
,涉及一种地形和目标检测方法。
技术介绍
视觉信息是人类识别周围环境的最重要信息来源,人类获得的信息80%左右是从视觉系统输入的。根据世界卫生组织统计,全世界有2.53亿视觉障碍人士。视障人士损失了正常的视觉,对颜色、形状的理解很困难。现在,他们中的许多人使用白手杖或导盲犬协助自己的日常生活。白手杖不足以在旅行期间解决所有的困难。导盲犬可以引导视障人士以避免在道路上行走时的危险,但是因为训练导盲犬需要很大的成本,它们不能用于所有视觉障碍者。因此,手杖、导盲犬等传统工具无法为他们出行提供充分的协助。自从各种电子出行辅助(ETA)设备开发以来,已被视为一种辅助视障者在不同情况下出行的有效的方法。为了帮助用户找到通路,许多辅助系统部署深度相机来检测可及的路径和障碍,也有很多辅助系统针对盲人辅助实现了楼梯检测、行人检测、车辆检测等。但是同时运行这些检测方法一方面增加了延迟,一方面也加剧了计算资源的负担。因此,一个能够将各种地形和目标统一在一个框架下同时完成检测,并且能够实现实时运行和快速输出的方法被迫切需要。
技术实现思路
本专利技术的目的在于针对现有技术的不足,提供一种地形和目标检测方法。本专利技术采用如下技术方案:一种地形和目标检测方法,该方法通过一彩色相机获取待检测区域的彩色图像,然后将彩色图像Color输入预先训练的神经网络模型,得到语义分割图像Semantics,即完成对待检测区域的地形和目标检测。所述的神经网络模型通过以下方法训练得到:从大型的语义分割数据集中获取训练数据集 ...
【技术保护点】
1.一种地形和目标检测方法,其特征在于,该方法通过一彩色相机获取待检测区域的彩色图像,然后将彩色图像Color输入预先训练的神经网络模型,得到语义分割图像Semantics,即完成对待检测区域的地形和目标检测。所述的神经网络模型通过以下方法训练得到:从大型的语义分割数据集中获取训练数据集,包括m张彩色图像Color与其一一对应的m张标记图像Label,所述对应关系如下:标记图像Label中的像素单元与彩色图像Color中的像素单元一一对应,标记图像Label中的像素单元标记彩色图像Color中的像素单元的语义标号。m≥10000。所述像素单元为:来源于同一物体的所有像素点组成的单元,同一类别的物体用一语义标号进行标识。以彩色图像Color为输入,标记图像Label为输出,对语义分割模型进行训练,所述基于神经网络的语义分割模型中每一层网络如下表所示,得到预先训练的神经网络模型。
【技术特征摘要】
1.一种地形和目标检测方法,其特征在于,该方法通过一彩色相机获取待检测区域的彩色图像,然后将彩色图像Color输入预先训练的神经网络模型,得到语义分割图像Semantics,即完成对待检测区域的地形和目标检测。所述的神经网络模型通过以下方法训练得到:从大型的语义分割数据集中获取训练数据集,包括m张彩色图像Color与其一一对应的m张标记图像Label,所述对应关系如下:标记图像Label中的像素单元与彩色图像Color中的像素单元一一对应,标记图像Label中的像素单元标记彩色图像Color中的像素单元的语义标号。m≥10000。所述像素单元为:来源于同一物体的所有像素点组成的单元,同一类别的物体用一语义标号进行标识。以彩色图像Color为输入,标记图像Label为输出,对语义分割模型进行训练,所述基于神经网络的语义分割模型中每一层网络如下表所示,得到预先训练的神经网络模型。层号类型输出特征图的维数输出特征图的分辨率1下采样层16320×2402下采样层64160×1203-7一维分解瓶颈层64160×1208下采样层12880×609一维分解瓶颈层(扩张卷积率2)12880×6010一维分解瓶颈层(扩张卷积率4)12880×6011一维分解瓶颈层(扩张卷积率8)12880×6012一维分解瓶颈层(扩张卷积率16)12880×6013一维分解瓶颈层(扩张卷积率2)12880×6014一维分解瓶颈层(扩张卷积率4)12880×6015一维分解瓶颈层(扩张卷积率8)12880×6016一维分解瓶颈层(扩张卷积率2)12880×6017a第16层输出的原始特征图12880×6017b第16层输出的原始特征图的池化和卷积3280×6017c第16层输出的原始特征图的池化和卷积3240×3017d第16层输出的原始特征图的池化和卷积3220×1517e第16层输出的原始特征图的池化和卷积3210×817f第1...
【专利技术属性】
技术研发人员:杨恺伦,程瑞琦,汪凯巍,
申请(专利权)人:杭州视氪科技有限公司,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。