【技术实现步骤摘要】
基于目标检测的水下鱼类数据增强算法
[0001]本专利技术涉及目标检测技术,具体的,是一种基于目标检测的水下鱼类数据增强算法。
技术介绍
[0002]目标检测任务是计算机视觉领域的重要基础,其目的是检测图像或视频中是否存在特定类别的目标物体,并确定其所在区域坐标及类别信息;在计算机视觉任务中,遮挡现象非常普遍且复杂,发生遮挡的位置不定且形式多变,按照遮挡发生在目标间的相互关系,可分为类内、类间遮挡;目标检测任务中遮挡问题是一项具有挑战性的工作,由于存在遮挡导致物体的整体特征结构遭到破坏,在检测过程中容易发生漏检、误检等问题。
[0003]随着深度学习技术研究的快速发展,水下鱼类目标检测任务在检测准确率和速度上都得到了巨大提升,然而在实际场景中水下鱼类的检测面临复杂背景条件、多姿态旋转、多尺度变化及遮挡等问题,限制了检测性能的提升;水下鱼类目标检测器的工作原理是根据深度神经网络获取的鱼体特征信息来进行鱼类的识别定位,遮挡目标由于遮挡影响了目标的特征提取导致检测器无法正确判断。
[0004]解决水下鱼类目标检测遮 ...
【技术保护点】
【技术特征摘要】
1.一种基于目标检测的水下鱼类数据增强算法,其特征在于:步骤包括:1)采用归一化的方式来表示目标物体的位置信息,进行归一化处理后的相对坐标是以在特征图上的比例为原则,根据图像的像素值就能得到相应的目标框;2)对于目标检测中心点坐标结合宽高比的边界框标签,使用以下公式进行归一化:x_norm=(x
‑
x_min)/width
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)y_norm=(y
‑
y_min)/height
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)w_ratio_norm=log(w/w_anchor)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)h_ratio_norm=log(h/h_anchor)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)x和y是边界框的中心点坐标,w和h是边界框的宽和高,w_anchor和h_anchor是预定义的锚框(anchor)的宽和高,width和height是图像的宽和高;3)映射:归一化的结果为在0到1之间的值,使用默认的锚框尺寸进行标签的计算,通常最终的值会在
‑
1到1之间,所以需要将其映射到0到1的范围内,具体使用以下公式进行映射:x_norm=(x_norm+1)/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)y_norm=(y_norm+1)/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)w_ratio_norm=(w_ratio_norm+1)/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)h_ratio_norm=(h_ratio_norm+1)/2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)4)根据原始鱼类数据集的图片标签标注的边界框信息,结合鱼类形态特殊性和标签信息多为矩形的特征,得到定点裁剪后的新的鱼类数据图片标注的边界框信息。2.根据权利要求1所述的一种基于目标检测的水下鱼类数据增强算法,其特征在于:锚框的绝对坐标是...
【专利技术属性】
技术研发人员:王超,陈宏铭,
申请(专利权)人:苏州芯运旺电子科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。