室内场景语义分割方法、装置、设备和介质制造方法及图纸

技术编号：37811056 阅读：18 留言：0更新日期：2023-06-09 09:41

本申请提供了室内场景语义分割方法、装置、设备和介质，其中该方法包括：获取给定室内场景的场景图像；将所述场景图像中的三通道彩色图像和深度图像进行多模态特征融合，获得融合特征图；将所述融合特征图进行位置编码后输入语义分割神经辐射场网络，获得室内场景信息；对所述室内场景信息进行上采样处理，且通过渲染获得室内场景语义分割图。本申请提出的方法能够有效融合三通道彩色图像和深度图像，利用少量语义标签信息获得更密集准确的语义分割效果。分割效果。分割效果。

全部详细技术资料下载

【技术实现步骤摘要】
室内场景语义分割方法、装置、设备和介质

[0001]本申请涉及计算机视觉领域，具体涉及一种室内场景语义分割方法、装置、设备和介质。

技术介绍

[0002]语义分割是图像分割中的重要领域，目前广泛应用于自动驾驶、精准农业以及地质检测以及其它各种不同的领域。在自动驾驶领域，语义分割提供有关道路上自由空间的信息，以及检测车道标记和交通标志等信息；在精准农业领域，作物和杂草的语义分割可以帮助实现除草行为的实时触发，减少需要在田间喷洒的除草剂的数量；地质检测，识别卫星图像上每个像素的土地覆盖类型(例如，城市、农业、水等区域)。
[0003]即便语义分割在众多领域都有着不同的应用。但是在将语义分割应用于室内场景之下的目前在对室内场景进行语义分割时，现有的大多数工作只是简单地假设深度测量是准确的，且与场景图像像素能够良好地对齐，由此将该问题建模为交叉模式特征融合以获得更好的特征表示从而实现更准确的分割。但是，由于其场景内部的空间复杂度高、环境变化多样，通常传感器无法获得令人满意的精准的深度结果，实际的深度数据往往比较嘈杂，这可能会随着网络的深入而降低对室内场景分割的准确性。若是想要获取室内场景精准的语义分割效果，则需要依托于室内场景数据集中的大量语义标签，而这些语义标签一般通过人工标注或半监督的方法获得，导致需要耗费高额的训练成本。

技术实现思路

[0004]本申请的一个目的在于通过利用少量语义标签获得准确的语义分割效果，解决需要大量语义标签且耗费高额训练成本的技术问题。
[0005]根据本申请实施...

【技术保护点】

【技术特征摘要】
1.一种室内场景语义分割方法，其特征在于，所述方法包括：获取给定室内场景的场景图像；将所述场景图像中的三通道彩色图像和深度图像进行多模态特征融合，获得融合特征图；将所述融合特征图进行位置编码后输入语义分割神经辐射场网络，获得室内场景信息；对所述室内场景信息进行上采样处理，且通过渲染获得室内场景语义分割图。2.根据权利要求1所述的方法，其特征在于，所述获取给定室内场景的场景图像，包括：通过深度传感器摄像机拍摄室内场景，获取室内场景的场景图像。3.根据权利要求1所述的方法，其特征在于，所述将所述场景图像中的三通道彩色图像和深度图像进行多模态特征融合，获得融合特征图，包括：串联场景图像中的三通道彩色图像和深度图像，获得初步融合特征图；通过卷积学习所述初步融合特征图中三通道融合的权重分布，获得学习的权重；通过阈值函数将所述学习的权重映射于权重向量范围，获得映射后的权重向量值；将所述初步融合特征图和所述映射后的权重向量值进行点乘，获得融合特征图。4.根据权利要求1所述的方法，其特征在于，所述将所述融合特征图进行位置编码后输入语义分割神经辐射场网络，获得室内场景信息，包括：对所述融合特征图进行位置编码，获得融合特征图的向量坐标和观察方向；将所述融合特征图的向量坐标和观察方向输入多层神经网络获得室内场景信息。5.一种室内场景语义分割装置，其特征在于，所述装置包括：场景图像获取模块，用于获取给定室内场景的场景图像；特征融合模块，用于将所述场景图像中的三通道彩色图像和深度图像进行多模态特征融合，获得融合特征图；场景信息获取模块，用于将所述融合特征图进行位置编码后...

【专利技术属性】
技术研发人员：张子慧，赖坚，
申请(专利权)人：深圳市金地数字科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人