一种面向水下机器人智能作业的鱼群目标识别方法技术

技术编号:24577050 阅读:61 留言:0更新日期:2020-06-21 00:31
本发明专利技术提出了一种面向水下机器人智能作业的鱼群目标识别方法,通过采集水下图像,并对图像中的水下目标逐个标记,形成属性文件,图像与属性文件共同组成数据集;建立鱼群目标检测和识别深度卷积神经网络,将网络输出的三个预测尺度增加为四个;利用数据集对构建的深度卷积神经网络进行训练,并采用K‑medians算法进行聚类得到Anchor Box的宽高尺寸作为训练参数,输入搭建的深度卷积神经网络;最后利用训练好的深度卷积神经网络对水下目标进行识别和分类,并采用改进的非极大值抑制算法模型识别和分类结果进行处理。本发明专利技术可以在浑浊度高,光线暗的复杂水下环境中提高对于密集分布且存在大量遮挡情况下的水下目标的识别精度,同时该方法具有较强的鲁棒性和泛化能力。

A fish target recognition method for intelligent operation of underwater robot

【技术实现步骤摘要】
一种面向水下机器人智能作业的鱼群目标识别方法
本专利技术涉及一种面向水下机器人智能作业的鱼群目标识别方法,属于目标识别领域。
技术介绍
深海探测与作业技术是海洋技术研究的重要领域之一。水下机器人包括有缆水下机器人(RemoteOperatedVehicles,ROVs)和无缆水下机器人(AutonomousUnderwaterVehicles,AUVs),它们是目前最先进的深海探测与作业装备。要实现深海探测与作业,水下机器人必须能快速感知海底环境,并对感兴趣的目标进行准确识别。因此,利用装有水下光学摄像机的AUVs对水下感兴趣目标进行实时识别具有重要研究价值和应用前景。传统的目标识别方法大多数是基于局部特征的识别,通过提取一定的特征点做统计计算,然后利用特征匹配的方法做目标识别,常用的有SIFT特征、SURF特征等。但是这种基于特征匹配的方法在目标背景较为复杂时鲁棒性能较差,这使得目标识别精度较低,并且时间复杂度高,泛化能力差。由于深度学习的快速发展,卷积神经网络在计算机视觉领域得到广泛的应用,YOLOv3算法作为一种同时兼顾检本文档来自技高网...

【技术保护点】
1.一种面向水下机器人智能作业的鱼群目标识别方法,其特征在于:包括以下步骤:/n步骤1:利用光学相机在不同水下环境下进行图像采集;/n步骤2:将步骤1中采集到的水下图像分割为宽高维度统一的图像;/n步骤3:随机选取经过步骤2处理后的图像,图像中包括包含水下目标的图像和不包含水下目标的图像,并且对图像中的水下目标逐个进行标记,标记后每张图像对应生成含有标记信息的属性文件;图像与对应的属性文件共同组成数据集;/n步骤4:搭建鱼群目标检测和识别深度卷积神经网络:/n所述深度卷积神经网络包括若干CBR3、CBR1、Res以及Up sample单元;其中CBR3由填充层、3x3卷积层、批量归一化层和一个...

【技术特征摘要】
1.一种面向水下机器人智能作业的鱼群目标识别方法,其特征在于:包括以下步骤:
步骤1:利用光学相机在不同水下环境下进行图像采集;
步骤2:将步骤1中采集到的水下图像分割为宽高维度统一的图像;
步骤3:随机选取经过步骤2处理后的图像,图像中包括包含水下目标的图像和不包含水下目标的图像,并且对图像中的水下目标逐个进行标记,标记后每张图像对应生成含有标记信息的属性文件;图像与对应的属性文件共同组成数据集;
步骤4:搭建鱼群目标检测和识别深度卷积神经网络:
所述深度卷积神经网络包括若干CBR3、CBR1、Res以及Upsample单元;其中CBR3由填充层、3x3卷积层、批量归一化层和一个激活函数层组成;CBR1由填充层、1x1卷积层、批量归一化层和一个激活函数层组成;残差单元Res由若干1x1卷积层和3x3卷积层组成;Upsample是指上采样;
网络输入首先经过两个CBR3单元,然后经过5组残差单元,再经过一个CBR1单元、一个CBR3单元,此时网络输出一方面经过一个CBR1单元,得到第一个特征尺度输出,另一方面经过一个CBR1单元,一个上采样Upsample后与第4组残差单元的网络输出进行融合,再经过一个CBR1单元、一个CBR3单元,此时网络输出一方面经过一个CBR1单元,得到第二个特征尺度输出,另一方面经过一个CBR1单元,一个上采样Upsample后与第3组残差单元的网络输出进行融合,再经过一个CBR1单元、一个CBR3单元,此时网络输出一方面经过一个CBR1单元,得到第三个特征尺度输出,另一方面经过一个CBR1单元,一个上采样Upsample后与第2组残差单元的网络输出进行融合,再经过一个CBR1单元、一个CBR3单元、一个CBR1单元,得到第四个特征尺度输出;
步骤5:利用步骤3获得的数据集对步骤4构建的深度卷积神经网络进行训练;
步骤6:利用步骤5中训练好的深度卷积神经网络对水下目标进行识别和分类。


2.根据权利要求1所述一种面向水下机器人智能作业的鱼群目标识别方法,其特征在于:步骤5中,采用K-medians算法进行聚类得到AnchorBox的宽高尺寸作为训练参数,输入步骤4中搭建的深度卷积神经网络中,具体过程为:
步骤5.1:步骤3制作的数据集中包含每张图像对应的属性文件,属性文件包含标注框在图像中的位置信息:
(xj,yj,wj,hj),j∈{1,2,...,N}
其中,(xj,yj)是标注框的中心点,(wj,hj)是标注框的宽和高,N是标注框的个数;
步骤5.2:随机给定k个聚类中心点(Wi,Hi),i∈{1,2,...,k},其中(Wi,Hi)是AnchorBox的宽和高尺寸;
步骤5.3:计算每个标注框和每个聚类中心点的距离:
d(box,centroid)=1-IOU(box,centroid)
计算时每个标注框的中心点都与聚类中心重合,得到
d=1-IOU[(xj,yj,wj,hj),(xj,yj,Wi,Hi)],j∈{1,2,...,N},i∈{1,2,......

【专利技术属性】
技术研发人员:刘明雍石廷超牛云黄宇轩杨扬汪培新
申请(专利权)人:西北工业大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1