基于卷积神经网络的体素标记方法、装置、终端及介质制造方法及图纸

技术编号:38341947 阅读:27 留言:0更新日期:2023-08-02 09:22
本发明专利技术提供一种基于卷积神经网络的体素标记方法、装置、终端及介质,包括:获取历史场景体素化数据,并对其进行人工标记以得到历史体素标记数据;将历史场景体素化数据作为输入以及将历史体素标记数据作为输出以训练基于卷积神经网络的VoxelAI模型;利用其对目标场景体素化数据进行自动化标记,以得到目标体素标记数据。本申请提供的VoxelAI模型通过对3D体素化数据进行数据展开以形成多层二维特征图,可以实现卷积神经网络对3D体素化数据进行学习,进而实现对3D体素化数据的自动化标记,不仅解决了人工标记成本过高的问题,而且提高了标记效率。了标记效率。了标记效率。

【技术实现步骤摘要】
基于卷积神经网络的体素标记方法、装置、终端及介质


[0001]本申请涉及计算机
,特别是涉及一种基于卷积神经网络的体素标记方法、装置、终端及介质。

技术介绍

[0002]体素(Voxel)是体积元素(Volume Pixel)的简称,包含体素的立体可以通过立体渲染或者提取给定阈值轮廓的多边形等值面表现出来。一如其名,是数字数据于三维空间分割上的最小单位,体素用于三维成像、科学数据与医学影像等领域。体素(Voxel)也可理解为像素(pixel)、体积(volume)和元素(element)的组合词,相当于3D空间中的像素。如图1所示,展示为某一包围盒的体素示意图,其中,每一个立方体都表示一个体素(Voxel);height表示该包围盒的高度,本图以5个体素高度为例;depth表示该包围盒的深度,本图以5个体素深度为例;width表示该包围盒的宽度,本图以5个体素宽度为例;boundsMin(local origin)表示该包围盒的最小位置(局部原点);boundsMax表示该包围盒的最大位置;cellHeight表示栅格高度即体素高度;ce本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于卷积神经网络的体素标记方法,其特征在于,所述方法包括:获取历史场景体素化数据,并对其进行人工标记以得到历史体素标记数据;将所述历史场景体素化数据作为输入以及将所述历史体素标记数据作为输出以训练基于卷积神经网络的VoxelAI模型;利用所述VoxelAI模型对目标场景体素化数据进行自动化标记,以得到目标体素标记数据。2.根据权利要求1所述的一种基于卷积神经网络的体素标记方法,其特征在于,所述获取历史场景体素化数据包括:获取历史三维场景中所有物体的多边形网格数据并进行体素化处理,以得到历史场景体素化数据;其中,所述历史场景体素化数据表征历史三维场景中所有体素的属性信息的集合;所述体素的属性信息包括对应体素的定位数据、层级数据、高度数据。3.根据权利要求2所述的一种基于卷积神经网络的体素标记方法,其特征在于,将所述历史场景体素化数据作为输入以及将所述历史体素标记数据作为输出以训练基于卷积神经网络的VoxelAI模型,具体过程包括:将所述历史场景体素化数据根据实际需求进行数据展开,以得到对应场景中所有体素的多层二维特征图;其中,所述二维特征图用以表征当前体素与周边体素的关联特征信息;所述多层二维特征图包括多个不同维度的所述二维特征图;对所述多层二维特征图进行卷积、池化操作,并结合所述历史场景体素化数据作为卷积神经网络的全连接层的输入,并将所述历史体素标记数据作为输出进行监督学习,以训练基于卷积神经网络的VoxelAI模型。4.根据权利要求3所述的一种基于卷积神经网络的体素标记方法,其特征在于,将所述历史场景体素化数据根据实际需求进行数据展开,以得到对应场景中所有体素的多层二维特征图,具体包括以下任意一种或多种的组合:当实际需求为判断场景中对应当前体素与周边体素是否平滑时,提取当前体素与周边体素的高度信息,并依次判断周边体素与当前体素的高度差是否在预设平滑度范围内,以得到当前体素与周边体素的二维平滑度特征图;当实际需求为判断场景中对应当前体素与周边体素是否可行走时,提取当前体素与周边体素的高度信息,并依次判断周边体素与当前体素的高度差是否在行走高度范围内,以得到当前体素与周边体素的二维行走高度特征图;当实际需求为判断场景中对应当前体素与周边体素是否可跳跃时,提取当前体素与周边体素的高度信息,并依次判断周边体素...

【专利技术属性】
技术研发人员:迟庆鹏
申请(专利权)人:上海灵刃网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1