路面测距方法及装置制造方法及图纸

技术编号：22135625 阅读：67 留言：0更新日期：2019-09-18 09:17

本发明专利技术实施例提供一种路面测距方法及装置，其中方法包括：将左、右视角的两张图片输入至预先训练的视差子网络中，输出所述两张图片的视差结果和所述两张图片中主视角图片的特征图；将所述主视角图片的特征图输入至预先训练的语义子网络，输出所述主视角图片的场景分割结果；根据场景分割结果的路面区域，从所述视差结果中提取出所述路面区域的视差结果，并将所述路面区域的视差结果转换为距离值；从所述主视角图片中确定关键距离值的像素位置并拟合出示距线。本发明专利技术实施例相比现有技术更加鲁棒快速，并且能够更精准地表达出图像中的距离。

Pavement Ranging Method and Device

全部详细技术资料下载

【技术实现步骤摘要】
路面测距方法及装置
本专利技术涉及测距
，更具体地，涉及一种路面测距方法及装置。
技术介绍
双目视觉和场景分割分属于计算机视觉领域中的低层级(low-level)问题和高层级(high-level)问题，其中双目视觉是视觉领域中最基础的问题之一，与人类使用双眼观察世界类似。双目视觉系统一般由双摄像机从不同的视点同时获取场景的数字图像，并基于视差原理恢复出物体的三维几何信息，估计与场景中不同物体的距离。双目视觉具有成本低、效率高、精度合适和系统结构简单等优点，被广泛应用于深度预测、场景建模、视觉里程计、工业视觉测量等多个任务中。场景分割是视觉中的另一个经典问题，它是从像素水平理解整幅图像，其目标是给出每一个像素区域的高级语义类别，它常用于场景理解、环境感知等任务中。最近几年，随着对深度卷积神经网络模型的深入研究，特别是全卷积(fullyconvolutional)模型在立体匹配和语义分割上的成功应用，视差估计和像素分类的准确率不断提升，同时端到端(end-to-end)模型还可以快速地预测出像素级别的视差图和语义图。然而，目前的大部分工作将视差估计和语义分割作为两个独立的问题进行研究。
技术实现思路
本专利技术实施例提供一种克服上述问题或者至少部分地解决上述问题的路面测距方法及装置。第一个方面，本专利技术实施例提供一种路面测距方法，包括：将左、右视角的两张图片输入至预先训练的视差子网络中，输出所述两张图片的视差结果和所述两张图片中主视角图片的特征图；将所述主视角图片的特征图输入至预先训练的语义子网络，输出所述主视角图片的场景分割结果；根据场景分割结果的路面...

【技术保护点】
1.一种路面测距方法，其特征在于，包括：将左、右视角的两张图片输入至预先训练的视差子网络中，输出所述两张图片的视差结果和所述两张图片中主视角图片的特征图；将所述主视角图片的特征图输入至预先训练的语义子网络，输出所述主视角图片的场景分割结果；根据场景分割结果的路面区域，从所述视差结果中提取出所述路面区域的视差结果，并将所述路面区域的视差结果转换为距离值；从所述主视角图片中确定关键距离值的像素位置并拟合出示距线；其中，所述视差子网络根据左、右视角的两张样本图片以及所述两张样本图片的视差结果标签训练而成，所述语义子网络根据所述两张样本图片中主视角样本图片的特征图以及所述主视角样本图片的场景分割标签训练而成。

【技术特征摘要】
1.一种路面测距方法，其特征在于，包括：将左、右视角的两张图片输入至预先训练的视差子网络中，输出所述两张图片的视差结果和所述两张图片中主视角图片的特征图；将所述主视角图片的特征图输入至预先训练的语义子网络，输出所述主视角图片的场景分割结果；根据场景分割结果的路面区域，从所述视差结果中提取出所述路面区域的视差结果，并将所述路面区域的视差结果转换为距离值；从所述主视角图片中确定关键距离值的像素位置并拟合出示距线；其中，所述视差子网络根据左、右视角的两张样本图片以及所述两张样本图片的视差结果标签训练而成，所述语义子网络根据所述两张样本图片中主视角样本图片的特征图以及所述主视角样本图片的场景分割标签训练而成。2.根据权利要求1所述的路面测距方法，其特征在于，所述视差子网络包括：特征提取模块，用于输入左、右视角的两张图片，输出左视角图片的特征图和右视角图片的特征图；匹配代价聚合模块，用于输入所述左、右视角图片的特征图，对所述左、右视角图片的特征图进行关联计算得到匹配特征，对主视角图片的特征图进行卷积操作得到主视角图片的转换特征，将所述匹配特征和主视角的转换特征进行连接，输出聚合特征；视差回归模块，采用编码-解码结构，用于输入所述聚合特征，输出预测的视差结果。3.根据权利要求2所述的路面测距方法，其特征在于，所述特征提取模块包括：第一卷积层，用于输入左、右视角的两张图片，输出左、右视角的两张图片的第一卷积特征值，所述第一卷积层的输入通道为3，输出通道为64，卷积核大小为3，步幅为2，尺寸缩放为1/2；第二卷积层，用于输入所述两张图片的第一卷积特征值，输出两张图片的第二卷积特征值，所述第二卷积层的输入通道为64，输出通道为64，卷积核大小为3，步幅为1，尺寸缩放为1/2；第三卷积层，用于输入所述两张图片的第二卷积特征值，输出两张图片的第三卷积特征值，所述第三卷积层的输入通道为64，输出通道为128，卷积核大小为3，步幅为1，尺寸缩放为1/2；池化层，用于输入所述两张图片的第三卷积特征值，输出两张图片的池化特征值，所述池化层的输入通道为128，输出通道为128，卷积核大小为3，步幅为2，尺寸缩放为1/4；第一残差层，用于输入所述两张图片的池化特征值，输出两张图片的第一残差特征值，所述第一残差层的输入通道为128，输出通道为256，卷积核大小为3，步幅为1，尺寸缩放为1/4；第二残差层，用于输入所述两张图片的第一残差特征值，输出两张图片的第二残差特征值，所述第二残差层的输入通道为256，输出通道为256，卷积核大小为3，步幅为1，尺寸缩放为1/4；第三残差层，用于输入所述两张图片的第二残差特征值，输出两张图片的第三残差特征值，所述第三残差层的输入通道为256，输出通道为256，卷积核大小为3，步幅为1，尺寸缩放为1/4；第四残差层，用于输入所述两张图片的第三残差特征值，输出两张图片的第四残差特征值，作为两张图片的特征图，所述第四残差层的输入通道为512，输出通道为512，卷积核大小为3，步幅为1，尺寸缩放为1/8。4.根据权利要求3所述的路面测距方法，其特征在于，所述匹配代价聚合模块包括：前置卷积层，用于输入两张图片的特征图，输出两张图片的第四卷积特征值，所述前置卷积层的输入通道为512，输出通道为256，卷积核大小为3，步幅为1，尺寸缩放为1/8；关联层，用于输入两张图片的第四卷积特征值，输出两张图片的匹配特征，所述关联层的输入通道为256，输出通道为33，最大位移为32，尺寸缩放为1/8；主视角卷积层，用于输入主视角图片的第四卷积特征值，输出主视角图片的转换特征，所述主视角卷积层的输入通道为256，输出通道为256，卷积核大小为3，步幅为1，尺寸缩放为1/8；连接层，用于输入两张图片的匹配特征和主视角图片的转换特征，输出聚合特征，所述连接层的输入通道为289，输出通道为289，尺寸缩放为1/8。5.根据权利要求4所述的路面测距方法，其特征在于，所述视差回归模块中的编码结构包括：第五残差层，用于输入聚合特征，输出第五残差特征，所述第五残差层的输入通道为409，输出通道为512，卷积核大小为3，步幅为1，尺寸缩放为1/8；第六残差层，用于输入第五残差特征，输出第六残差特征，所述第六残差层的输入通道为512，输出通道为512，卷积核大小为3，步幅为1，尺寸缩放为1/8；第七残差层，用于输入第六残差特征，输出第七残差特征，所述第七残差层的输入通道为512，输出通...

【专利技术属性】
技术研发人员：邓志东，杨国润，
申请(专利权)人：清华大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人