【技术实现步骤摘要】
一种基于非对称卷积的激光雷达点云语义分割方法
[0001]本专利技术涉及计算机视觉
,更具体地说,本专利技术涉及一种基于非对称卷积的激光雷达点云语义分割方法。
技术介绍
[0002]实现对周围环境的场景理解是自动驾驶领域最重要的任务之一。虽然二维图像的语义分割是实现场景理解的重要一步,但纯视觉传感器存在一些局限性,例如在光线不足的条件下无法有效获取信息、缺乏深度信息和有限的视野等。相比较之下,无论光照条件如何,激光雷达都能以高密度和广视角获取准确的深度信息,这使其成为自动驾驶环境感知部分更可靠的信息来源。因此,近年来激光雷达点云语义分割相关研究成为热点。
[0003]在保证模型推理达到实时效果的前提下,提升模型的检测精度具有重要的现实意义。当前的激光雷达点云语义分割模型可以根据点云编码方式的不同分为三大类:基于点的方法,基于体素的方法和基于投影的方法。在推理速度方面,较大的计算量和内存消耗导致基于点和基于体素的方法难以达到实时的推理效果,在实际部署和应用时会遇到困难。相比之下,基于投影的方法的推理速度有较大优势 ...
【技术保护点】
【技术特征摘要】
1.一种基于非对称卷积的激光雷达点云语义分割方法,其特征在于:包括如下步骤:步骤一:将激光雷达点云数据输入到基于投影的点云编码器中,得到编码后的点云;步骤二:将编码后的点云输入到非对称卷积骨干网络中,对点云进行特征提取;步骤三:将提取到的点云特征输入到上下文特征增强模块中,提取点云特征中的上下文特征信息;步骤四:将点云的特征信息输入到语义分类器中,识别出每个点云的语义类别,最终得到整个点云数据的语义分割结果;其中,步骤二中非对称卷积骨干网络由四个下采样非对称卷积模块和四个上采样非对称卷积模块构成;还采用三次跳跃连接将上采样结果(低层特征)与对应的下采样级联,有效地融合网络底层特征和高层特征,提高模型对细节信息的学习能力;在一次下采样过程中,先对特征进行步长为2的方形卷积运算,接下来分别用两组非对称卷积组合进行卷积运算,然后将运算结果相加并输出;这两组非对称卷积组合分别由3
×
1,1
×
3的非对称卷积核组和1
×
3,3
×
1的非对称卷积核组构成;下采样非对称卷积模块的公式为:F
out
=C3×1(C1×3(C3×3(F
in
)))+C1×3(C3×1(C3×3(F
in
)))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)式中F
in
和F
out
分别为输入特征和输出特征,C3×3、C1×3和C3×1分别为3
×
3、1
×
3和3
×
1的卷积运算;在一次上采样过程中,先对特征进行双线性插值,然后将其与跳跃连接的低阶特征相拼接,最后使用一组非对称卷积对特征进行卷积运算,该非对称卷积组由1
×
3和3...
【专利技术属性】
技术研发人员:宋绍京,苗志清,刘再庆,艾鲁霞,
申请(专利权)人:上海第二工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。