基于动态高斯建模的多模态数据融合方法、装置和车辆制造方法及图纸

技术编号：45718817 阅读：26 留言：0更新日期：2025-07-04 18:40

本公开提供了一种基于动态高斯建模的多模态数据融合方法、装置和车辆。本公开一实施例中，基于动态高斯建模的多模态数据融合方法包括：获取连续多帧多模态数据，通过多模态数据获得3D体素特征和多视角图像特征，基于3D体素特征构建动态高斯参数化模型，利用动态高斯参数化模型和多视角图像特征生成多视角高斯特征并将多视角高斯特征投影至动态分辨率BEV空间，从而获得BEV特征，3D体素特征采用动态体素化得到，并且该动态体素化基于八叉树稀疏体素编码并根据场景复杂度自适应调整分辨率。本公开能够在保证感知精度的同时优化计算资源利用率。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及自动驾驶，尤其涉及一种基于动态高斯建模的多模态数据融合方法、装置和车辆。

技术介绍

1、在现有自动驾驶系统中，基于激光雷达（lidar）点云的三维场景感知多采用固定分辨率体素网格化处理方法。

2、由于体素网格分辨率固定且与场景稀疏性解耦，在诸如空旷道路、低障碍密度环境等点云分布稀疏区域仍需维持高分辨率体素划分，导致无效内存占用显著增加，严重制约诸如车载嵌入式计算单元边缘计算设备的实时处理能力，难以满足自动驾驶系统的低延迟要求。

3、同时，针对车辆、行人等动态目标的建模精度受限于固定体素粒度，在目标边缘区域易产生体素化模糊效应，致使诸如车辆后视镜曲面结构、行人肢体运动姿态等关键几何细节丢失，进而降低目标识别与运动预测的准确性，增加复杂交通场景下的安全风险。

4、也即，三维场景感知采用固定分辨率体素化方法难以有效平衡计算资源分配与场景表征精度间的矛盾，尤其在动态目标密集且空间结构复杂的城区道路场景中，更为突出。因此，亟需一种新的3d场景感知技术以在保证感知精度的同时优化计算资源利用率，从而提升自...

【技术保护点】

1.一种基于动态高斯建模的多模态数据融合方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述3D体素特征通过如下方式得到：

3.根据权利要求1所述的方法，其特征在于，所述基于所述3D体素特征构建动态高斯参数化模型，包括：

4.根据权利要求3所述的方法，其特征在于，所述高斯球体参数可以包括位置、协方差矩阵、语义概率，所述语义概率表示高斯球体所属的语义类别及其概率值。

5.根据权利要求1所述的方法，其特征在于，所述多视角高斯特征通过可微分高斯溅射得到。

6.根据权利要求1所述的方法，其特征在于，所述将所述...

【技术特征摘要】

1.一种基于动态高斯建模的多模态数据融合方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述3d体素特征通过如下方式得到：

3.根据权利要求1所述的方法，其特征在于，所述基于所述3d体素特征构建动态高斯参数化模型，包括：

5.根据权利要求1所述的方法，其特征在于，所述多视角高斯特征通过可微分高斯溅射得到。

6.根据权利要求1所述的方法，其特征在于，所述将所述多视角高斯特征投影至动态分辨率bev空间，包括：基于transformer架构将多视角高斯特征投影至动态分辨率bev空间。

...

【专利技术属性】
技术研发人员：石亚飞，俞锋，张雷，褚佳鑫，白云飞，吴淼，张天雷，邢加伟，
申请(专利权)人：张家港港务集团有限公司港埠分公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人