当前位置: 首页 > 专利查询>上海大学专利>正文

一种声呐水下目标检测方法技术

技术编号:27977199 阅读:217 留言:0更新日期:2021-04-06 14:11
本发明专利技术公开一种声呐水下目标检测方法,具体步骤包括:通过对水下目标图像进行预处理,得到待检测数据;提取待检测数据特征,然后选择先验框,提取特征图,对特征图中的先验框进行处理计算,得到边界框值,根据边界框值,得到检测结果,并对检测结果进行修正。本发明专利技术对前视声呐中的目标检测提供了一种方法,相较于传统方法,减少了时间,提升了检测的准确度和速度,能有效识别特定目标,并且可以对连续帧的声呐图像进行处理,较为准确的在前视声呐图像中显示当前图像中目标的位置和类型,能够达到实时检测的效果。

【技术实现步骤摘要】
一种声呐水下目标检测方法
本专利技术属于人工智能与水声电子信息的交叉领域,具体涉及一种基于YOLOv3深度学习网络的前视声呐图像目标检测识别方法。
技术介绍
由于水下恶劣危险的环境,海洋产业在发展中面临着迫切的产业智能化升级需求。为了解决该类问题,光学技术、声学技术和AI算法逐渐融入到海洋产业中去。随着技术的发展,水下目标检测技术发展很快,比如水下地形地貌的探测、鱼雷的探测技术等等,而声学图像在水下目标检测中探程远、实用性强,声呐水下目标的检测有着广泛的应用前景和发展空间。声呐设备主要包括前视声呐、侧扫声呐和合成孔径声呐在航行器行进过程中不断发射和接收声呐信号,实现检测。前视声呐分为单波束和多波束两种,其中单波束前视声呐形成一个波束,利用基阵的自然方向性进行定向,一次收发过程中只能观察一个波束所覆盖的空间,探测较大的固定区域时,需要转动波束使其覆盖整个区域多波束前视声呐可同时发射多个波束形成扇形探测区,可进行条带式测量。声呐设备采集到的图像干扰大,受噪声影响大,水下小目标的检测存在着许多问题。目前,声呐的工作性能除了受自身技术参数的限制之外,还受环境因素影响很大,这将导致声波的折射、扩散、吸收、噪声等问题。深度学习模型由于强大的表示能力,加之数据量的积累和计算力的进步,成为机器视觉的热点,而目标检测识别则是机器视觉中的重要问题。对于图像的理解可以分为好几个层次,分类是指将图像归为某一类别,检测,给出的是对整张图片的内容描述,是对目标的类别的识别和位置的确定,分割任务则是值对背景的分离和对目标轮廓的分离。近些年的水下目标检测方法主要有基于模板匹配的方法、基于数理统计的方法、浅层神经网络的方法等等。现有声呐水下目标检测技术中存在声呐数据集少,用于网络训练的数据集不足;声呐图像不清晰,干扰多,声呐图像位置不定,不同目标直接特征差异不大或是相同目标由于背景干扰导致差异较大的情况同时存在;声呐图像目标识别率不同等问题。
技术实现思路
针对上述现有技术所存在的问题,本专利技术提供一种可以使用任意数据集,检测准确率高且目标识别准确的声呐水下目标检测方法,具体包括以下步骤:步骤一:采集预训练水下目标图像,对预训练水下目标图像进行预处理,得到训练数据集;步骤二:构建特征提取网络,基于训练数据集,训练特征提取网络;步骤三:采集水下目标图像,对所述水下目标图像进行预处理,得到待检测数据集;将待检测数据集输入特征提取网络,通过所述特征提取网络,将所述待检测数据集划分网格,并提取所述水下图像特征;步骤四:基于所述水下目标图像的特征,对待检测数据集进行k-means聚类,然后选择预测边界框,将所述预测边界框的聚类簇和尺度进行排序,根据所述排序结果,将所述聚类簇均分到各个尺度上,得到不同尺度的特征图;步骤五:构建边界框预测网络,基于所述特征图,通过边界框预测网络进行卷积预测,得到预测边界框值;步骤六:对预测边界框值进行后处理,得到对应数据的检测结果;步骤七:对水下目标图像数据的相邻帧分别进行检测,得到相邻帧的检测结果,根据相邻帧的检测结果,对图像预测结果进行修正。优选的,所述步骤二基于DarkNet53构建特征提取网络。优选的,所述步骤一中的预训练水下目标图像为前视声呐扇形图像中截取的矩形图像。优选的,所述步骤一中的预处理,具体步骤为:对截取的矩形图像调整形状大小,然后对大小调整后的图像进行背景填充。优选的,所述步骤七中所述待检测数据为连续帧的待检测数据时,通过前后帧的关联性对预测结果进行优化。优选的,所述步骤五,具体步骤包括:基于RPN网络,构建边界框预测网络,所述边界框预测网络使用直接的位置预测,得到预测边界框的值。优选的,所述步骤六,具体步骤包括,根据预测边界框的左下角网格的偏移量,使用Sigmoid限制,控制所述偏移量在0-1,将预测边界框的中心约束在当前中心所在网格中,得到处理后的预测边界框;基于处理后的预测边界框,通过非极大值抑制算法,将处理后的预测边界框按类别划分,根据得分降序排列,计算其中一个边界框和其他边界框的交并比,通过设定交并比的阈值,筛选边界框,得到目标边界框;基于目标边界框,使用逻辑回归计算每个预测边界框的目标置信度,使用平方误差计算目标边界框参数,得到检测结果;所述检测结果为目标置信度和目标边界框参数。优选的,所述步骤五边界框预测网络的卷积核的数量为(4+1+c)*k个,其中每个预测边界框包括:4*k个表示目标边界框的偏移量的参数,k个表示目标边界框内包含目标概率的参数,c*k个表示预测k个预设边界框对应c个目标类别概率的参数。优选的,所述步骤四中特征图包括两个维度包括平面维度和深度维度;所述平面维度为m*m,对应的有m*m个网格用于预测;所述深度的维度为(4+1+c)*k。本专利技术的有益效果:1、针对前视声呐数据,从数据集处理出发,对于一系列的前视声呐数据,框出待检测目标所在区域,制作对应数据集,针对不同目标大小的区域进行不同预处理,针对前视声呐图像数据,处理出能适合深度学习网络输入且学习的图像数据,待检测区域大小可任意,预处理部分针对待检测区域做对应处理后输入检测网络,网络也能够完整运行并达到同样的技术效果;2、本专利技术使用深度学习的方法,将经过处理的前视声呐图像数据集送入网络中训练,提取特征,使用深度神经网络实现目标检测的功能,检测速率、准确率与召回率指标高;3、本专利技术将前视声呐图像输入到YOLOv3网络模型中,在模型中完成特征提取、目标检测、目标分类。最终准确给出目标置信度结果、目标类别以及目标所处相对于图像的位置。同时可以通过有关联的前后帧声呐数据,在判断模块中按照一定策略对当前声呐图片检测结果进行调整,同样可以达到上述效果;4、本专利技术采用多尺度预测,对于声呐图像中不同大小的目标可同时使用一个网络进行预测,无需反复训练模型。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为基于YOLOv3的前视声呐图像目标检测识别方法的流程图;图2为基于YOLOv3的前视声呐图像目标检测识别方法的神经网络部分的结构图;图3为基于YOLOv3的前视声呐图像目标检测识别方法神经网络训练过程的曲线图,其中图3(a)-(h)分别对应广义交并比变化曲线、Obj值变化曲线、查准率变化曲线、查全率变化曲线、验证集广义交并比变化曲线、验证集Obj值变化曲线、平均精度变化曲线、F1值变化曲线;图4为经过预处理后的需要放入网络进行训练的图像数据示例图,图4(a)-(d)对应第一类目标图像示例图,图4(e)为第二类目标图像示例图,图4(f)为第三类目标图像示例图,图4(g)为第四类目标图像示本文档来自技高网
...

【技术保护点】
1.一种声呐水下目标检测方法,其特征在于,包括以下步骤:/n步骤一:采集预训练水下目标图像,对预训练水下目标图像进行预处理,得到训练数据集;/n步骤二:构建特征提取网络,基于训练数据集,训练特征提取网络;/n步骤三:采集水下目标图像,对所述水下目标图像进行预处理,得到待检测数据集;将待检测数据集输入特征提取网络,通过所述特征提取网络,将所述待检测数据集划分网格,并提取所述水下图像特征;/n步骤四:基于所述水下目标图像的特征,对待检测数据集进行k-means聚类,然后选择预测边界框,将所述预测边界框的聚类簇和尺度进行排序,根据所述排序结果,将所述聚类簇均分到各个尺度上,得到不同尺度的特征图;/n步骤五:构建边界框预测网络,基于所述特征图,通过边界框预测网络进行卷积预测,得到预测边界框值;/n步骤六:对预测边界框值进行后处理,得到对应数据的检测结果;/n步骤七:对水下目标图像数据的相邻帧分别进行检测,得到相邻帧的检测结果,根据相邻帧的检测结果,对图像预测结果进行修正。/n

【技术特征摘要】
1.一种声呐水下目标检测方法,其特征在于,包括以下步骤:
步骤一:采集预训练水下目标图像,对预训练水下目标图像进行预处理,得到训练数据集;
步骤二:构建特征提取网络,基于训练数据集,训练特征提取网络;
步骤三:采集水下目标图像,对所述水下目标图像进行预处理,得到待检测数据集;将待检测数据集输入特征提取网络,通过所述特征提取网络,将所述待检测数据集划分网格,并提取所述水下图像特征;
步骤四:基于所述水下目标图像的特征,对待检测数据集进行k-means聚类,然后选择预测边界框,将所述预测边界框的聚类簇和尺度进行排序,根据所述排序结果,将所述聚类簇均分到各个尺度上,得到不同尺度的特征图;
步骤五:构建边界框预测网络,基于所述特征图,通过边界框预测网络进行卷积预测,得到预测边界框值;
步骤六:对预测边界框值进行后处理,得到对应数据的检测结果;
步骤七:对水下目标图像数据的相邻帧分别进行检测,得到相邻帧的检测结果,根据相邻帧的检测结果,对图像预测结果进行修正。


2.根据权利要求1所述一种声呐水下目标检测方法,其特征在于:
所述步骤二基于DarkNet53构建特征提取网络。


3.根据权利要求1所述一种声呐水下目标检测方法,其特征在于:
所述步骤一中的预训练水下目标图像为前视声呐扇形图像中截取的矩形图像。


4.根据权利要求3所述一种声呐水下目标检测方法,其特征在于:
所述步骤一中的预处理,具体步骤为:对截取的矩形图像调整形状大小,然后对大小调整后的图像进行背景填充。


5.根据权利要求1所述一种声呐水下目标检测方法,其特征在于:
所述步骤七中所述待检测数据为连续帧的待检测...

【专利技术属性】
技术研发人员:曾丹陆恬昳徐霁轩蔡周吟
申请(专利权)人:上海大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1