System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于前视三维声纳的水下场景智能感知方法及系统技术方案_技高网

一种基于前视三维声纳的水下场景智能感知方法及系统技术方案

技术编号:41769252 阅读:22 留言:0更新日期:2024-06-21 21:46
本申请公开了一种基于前视三维声纳的水下场景智能感知方法及系统,该方法将前视三维声纳与改进的PointNet语义识别相结合,使用基于前视三维声纳采集到的点云数据训练PointNet模型,将训练后的模型部署到平台端,PointNet模型对点云数据进行两次特征提取,分别得到局部特征向量和全局特征向量,将对局部特征向量和全局特征向量进行拼接得到高维语义特征向量,对高维语义特征向量进行特征分类得到语义识别结果;本申请中的技术方案提供了一种能够以端到端的方式处理点云数据的水下场景智能感知模型,能够对多种水下目标进行语义识别,准确判断目标类型,为基于前视三维声纳的水下环境智能感知任务提供了一种有效解决的手段。

【技术实现步骤摘要】

本申请涉及水声信号处理的,具体而言,涉及一种基于前视三维声纳的水下场景智能感知方法及系统


技术介绍

1、水下作业空间常存在光照不足、水体浑浊透光性差及水声信号干扰大的情况,必然增加水下环境感知与目标识别研究的复杂度。水下环境感知的手段有限,常用光视觉传感器和声纳两类,光视觉传感器只能用于水下光学成像清晰的水域,难以适应远距离与浑浊水下环境,声纳可用于远距离与浑浊水下环境,但由于各种干扰的存在,在水下探测时存在定位和方向偏差,目前只能利用阴影的方式对目标轮廓进行粗略估算,分辨率较低。三维声纳兼具水平和垂直窄波束,具有很强的抗混响能力,与二维成像声纳相比,更适合浑浊水和浅水等高混响环境下的探测。三维声纳可获取三维立体数据信息,能够根据图像判断水下物体的形态和位置,而且通过三维立体空间旋转,可从多个视角对水下目标物进行观测,可提高对水下复杂环境的判断能力。三维成像声纳主要有机械扫描、多波束电子扫描和基于二维面阵扫描三种形式。机械扫描的成像方式要想获得三维图像,需要利用单波束对探测场景进行全方位的扫描,成像速率过于低下。多波束电子扫描的方式通过相控阵技术,提高了扫描速度,但声脉冲的单次收发不能获得三维图像。基于二维面阵的三维成像声纳单次声脉冲发射,即可一次性获得场景中水平、垂直和距离三个维度的信息,图像刷新率高,增加垂直维度的信息能在较大程度上提高无人系统的自主识别能力。

2、目前常用的对水下场景感知的方法包括基于二维图像的目标识别方法和三维目标识别方法,基于二维图像的目标识别无法适用于水下复杂的环境。三维目标识别方法中常用基于局部特征、基于全局特征的物体识别方法、基于点云的方式、基于机器学习的物体识别方法。基于局部特征的方法(如点特征直方图pfh和快速点特征直方图fpfh方法)无需对处理数据进行分割,通过提取物体的关键点、边缘或者面片等局部特征并进行比对来完成物体的识别。基于全局特征的方法(如视点特征直方图vfh)和聚类视点特征直方图vvfh方法)需要从背景中将目标物体分割出来,通过描述和比对三维物体形状中的全部或者最显著的几何特征来完成物体的识别。传统的基于点云的方式(如采用icp算法),主要通过手工设计的特征对三维物体进行描述,具有一定的主观性和经验性,这就带来一个问题,即对于特征较复杂的三维物体丢失信息多,无法通过手工设计的特征提取出丰富的三维信息,还需要更多的参数调整和优化,从而使得识别问题变得困难。基于机器学习的物体识别方法根据三维数据表示形式的不同,主要分为基于体素卷积神经网络的方法、基于投影图卷积神经网络的方法、基于点云神经网络的方法等。根据现有研究可知,当前的这些方法主要是将三维点云前向投影成二维图像,利用二维图像目标识别方法对目标进行识别,并通过深度估计实现水下目标的识别,并不是直接处理三维点云数据,因此不可避免的存在信息丢失以及目标定位不准确的问题。

3、综上所述,目前急需一种定位准确、识别精度高的水下场景智能识别方法和系统。


技术实现思路

1、本申请的目的在于:提供了一种基于前视三维声纳的水下场景智能感知方法及系统,使用语义识别模型处理基于前视三维声纳采集到的点云数据,将目标的局部特征与全局特征相结合,提高识别精度,解决现有方法定位不准确且识别精度低的问题。

2、本申请的第一技术方案是:提供了一种基于前视三维声纳的水下场景智能感知方法及系统,该方法包括:

3、步骤1,使用前视三维声纳采集目标对象的回波数据,基于回波数据获取其包含的坐标信息和强度信息,并将回波数据转换为n×4的点云数据,对点云数据进行语义标注并划分为训练集和测试集;

4、步骤2,构建pointnet模型,将其输入层的通道数设置为m;

5、步骤3,将训练集输入pointnet模型中进行训练,pointnet模型对点云数据进行第一次特征提取,再对提取结果进行第二次特征提取,将两次特征提取得到的特征向量进行特征拼接得到高维语义特征向量,对高维语义特征向量进行特征分类得到语义识别结果,具体包括:

6、步骤3.1,pointnet模型对训练集中的点云数据进行第一次特征提取,得到局部特征向量;

7、步骤3.2,pointnet模型对局部特征向量进行第二次特征提取,得到全局特征向量;

8、步骤3.3,将局部特征向量和全局特征向量在维度上进行特征拼接,得到高维语义特征向量,对高维语义特征向量进行特征分类得到语义识别结果;

9、步骤4,使用测试集对pointnet模型进行测试,当pointnet模型的性能指标达到预设条件时停止训练;

10、步骤5,将训练后的pointnet模型部署到平台端,对语义识别结果进行后处理,并通过不同的颜色对语义识别结果进行显示。

11、进一步地,pointnet模型中包括t-net(3×3)网络、mlp(64,64)模型、t-net(64×64)网络和mlp(64,128,1024)模型,对点云数据进行第一次特征提取具体包括:使用t-net(3×3)网络对n×4的点云数据进行几何变换,使用mlp(64,64)模型对变换后的点云数据进行特征提取,得到n×64的局部特征向量,使用t-net(64×64)网络对局部特征向量进行几何变换,得到变换后的局部特征向量。

12、进一步地,pointnet模型中包括mlp(64,128,1024)模型,对局部特征向量进行第二次特征提取具体包括:使用mlp(64,128,1024)模型对局部特征向量进行特征提取得到n×1024的特征向量,使用对称函数对该特征向量进行处理,将局部特征映射到全局特征,对处理后的特征向量进行最大池化操作,得到n×1024的全局特征向量。

13、进一步地,pointnet模型中包括mlp(512,256,128)模型、mlp(128,m)模型,步骤3.3具体包括:将n×64的局部特征向量与n×1024的全局特征向量在行的维度上进行拼接,得到n×1088高维语义特征向量,使用mlp(512,256,128)模型和对高维语义特征向量进行特征提取,再使用mlp(128,m)模型进行特征分类,得到n×m的特征向量,其中,n×m的特征向量代表点云中n个点分别在m个类别标签上的概率。

14、进一步地,平台端包括显控端,步骤5具体包括:基于pointnet模型输出的n×m的特征向量,找到每个点的概率最大值对应的标签,将每个点的三维坐标、强度及标签进行合并,以数据包的形式发送给显控端,显控端为不同的标签分配不同的颜色并在可视化界面上进行显示。

15、进一步地,步骤2中,将pointnet模型的输入层的通道数设置为4,使其能够处理n×4的点云数据。

16、本申请的第二技术方案是:提供了一种基于前视三维声纳的水下场景智能感知系统,该系统包括数据采集模块、预处理模块、特征提取模块、后处理模块;

17、数据采集模块用于通过前视三维声纳采集目标对象的回波数据;

本文档来自技高网...

【技术保护点】

1.一种基于前视三维声纳的水下场景智能感知方法,其特征在于,该方法包括:

2.如权利要求1所述的基于前视三维声纳的水下场景智能感知方法,其特征在于,所述PointNet模型中包括T-Net(3×3)网络、MLP(64,64)模型、T-Net(64×64)网络和MLP(64,128,1024)模型,对点云数据进行第一次特征提取具体包括:使用T-Net(3×3)网络对n×4的点云数据进行几何变换,使用MLP(64,64)模型对变换后的点云数据进行特征提取,得到n×64的局部特征向量,使用T-Net(64×64)网络对局部特征向量进行几何变换,得到变换后的局部特征向量。

3.如权利要求2所述的基于前视三维声纳的水下场景智能感知方法,其特征在于,所述PointNet模型中包括MLP(64,128,1024)模型,对局部特征向量进行第二次特征提取具体包括:使用MLP(64,128,1024)模型对局部特征向量进行特征提取得到n×1024的特征向量,使用对称函数对该特征向量进行处理,将局部特征映射到全局特征,对处理后的特征向量进行最大池化操作,得到n×1024的全局特征向量。

4.如权利要求3所述的基于前视三维声纳的水下场景智能感知方法,其特征在于,所述PointNet模型中包括MLP(512,256,128)模型、MLP(128,m)模型,所述步骤3.3具体包括:将n×64的局部特征向量与n×1024的全局特征向量在行的维度上进行拼接,得到n×1088高维语义特征向量,使用MLP(512,256,128)模型和对高维语义特征向量进行特征提取,再使用MLP(128,m)模型进行特征分类,得到n×m的特征向量,其中,n×m的特征向量代表点云中n个点分别在m个类别标签上的概率。

5.如权利要求1所述的基于前视三维声纳的水下场景智能感知方法,其特征在于,所述平台端包括显控端,所述步骤5具体包括:基于PointNet模型输出的n×m的特征向量,找到每个点的概率最大值对应的标签,将每个点的三维坐标、强度及标签进行合并,以数据包的形式发送给显控端,显控端为不同的标签分配不同的颜色并在可视化界面上进行显示。

6.如权利要求1所述的基于前视三维声纳的水下场景智能感知方法,其特征在于,所述步骤2中,将PointNet模型的输入层的通道数设置为4,使其能够处理n×4的点云数据。

7.一种基于前视三维声纳的水下场景智能感知系统,其特征在于,该系统包括数据采集模块、预处理模块、特征提取模块、后处理模块;

8.如权利要求7所述的基于前视三维声纳的水下场景智能感知系统,其特征在于,所述水下场景智能感知系统用于执行权利要求1-6之一所述的方法。

...

【技术特征摘要】

1.一种基于前视三维声纳的水下场景智能感知方法,其特征在于,该方法包括:

2.如权利要求1所述的基于前视三维声纳的水下场景智能感知方法,其特征在于,所述pointnet模型中包括t-net(3×3)网络、mlp(64,64)模型、t-net(64×64)网络和mlp(64,128,1024)模型,对点云数据进行第一次特征提取具体包括:使用t-net(3×3)网络对n×4的点云数据进行几何变换,使用mlp(64,64)模型对变换后的点云数据进行特征提取,得到n×64的局部特征向量,使用t-net(64×64)网络对局部特征向量进行几何变换,得到变换后的局部特征向量。

3.如权利要求2所述的基于前视三维声纳的水下场景智能感知方法,其特征在于,所述pointnet模型中包括mlp(64,128,1024)模型,对局部特征向量进行第二次特征提取具体包括:使用mlp(64,128,1024)模型对局部特征向量进行特征提取得到n×1024的特征向量,使用对称函数对该特征向量进行处理,将局部特征映射到全局特征,对处理后的特征向量进行最大池化操作,得到n×1024的全局特征向量。

4.如权利要求3所述的基于前视三维声纳的水下场景智能感知方法,其特征在于,所述pointnet模型中包括mlp(512,256,128)模型、mlp...

【专利技术属性】
技术研发人员:钱斌毕坤
申请(专利权)人:苏州桑泰海洋仪器研发有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1