基于增强特征Yolo的目标旋转检测方法技术

技术编号：37668562 阅读：9 留言：0更新日期：2023-05-26 04:28

本发明专利技术的基于增强特征Yolo的目标旋转检测方法，属于人工智能的技术领域。获取目标待检测的图像数据，通过预设的检测框进行预处理，随机地应用在自然图像上，生成随机化后的图像数据；预处理后的每张图像，输入残差网络模型中并按预设规则进行图像特征的提取，每个残差块特征图满足预设倍数的递减变换，且分为多个输出分支，每个输出分支与上一级的输出分支满足所述预设倍数的关；取后三级的输出分支输出输入至FPN网络模型中，并对后三级的输出分支设置输出量，以确定输出的旋转检测框；对于FPN网络模型的输出检测信息，进行判断，若当前为训练阶段，计算损失，若，当前为预测阶段，直接输出检测框，从而提高检测的效率。从而提高检测的效率。从而提高检测的效率。

全部详细技术资料下载

【技术实现步骤摘要】
基于增强特征Yolo的目标旋转检测方法

[0001]本专利技术属于人工智能领域，尤其涉及一种基于增强特征Yolo的目标旋转检测方法。

技术介绍

[0002]目标检测是无人设备视觉感知中的重要任务之一，其主要功能是在二维平面图像上确定待检测类别目标的坐标位置。随着计算设备计算能力的提升，自2012年起，基于深度学习的目标检测方法逐渐流行，其主要包含单阶段目标检测和两阶段目标检测，其中：
[0003]单阶段目标检测的检测速度较快，而两阶段目标检测的检测精度较高。单阶段目标检测算法主要有YOLO(You Only Look Once)和SSD(Single Shot MultiBox Detector)，其能够在神经网络特征提取的基础上直接输出检测框的位置信息和类别信息；
[0004]两阶段目标检测算法主要有R
‑
CNN，Fast R
‑
CNN，Faster R
‑
CNN和R
‑
FCN，该类方法将目标检测任务分为两个阶段，第一阶段生成候选框，第二阶段对候选框进行调整并生成类别。
[0005]然而，当前主流的目标检测方法主要应用于水平目标检测任务，即检测框为具有一定大小的水平矩形框。在实际的应用场景中，目标物体的排列方式为任意旋转角度，且在特定条件下排列较为密集，若依然采用水平目标检测方法，会造成最终检测性能的下降，存在误检测和漏检测的情况，导致检测效率较低。

技术实现思路

[0006]有鉴于此，本专利技术提供一种...

【技术保护点】

【技术特征摘要】
1.一种基于增强特征Yolo的目标旋转检测方法，其特征在于，所述方法包括：获取目标待检测的图像数据，通过预设的检测框进行预处理；预处理后的每张图像，输入残差网络模型中并按与预设规则进行图像特征的提取，每个残差块特征图满足预设倍数的递减变换，且分为多个输出分支，每个输出分支与上一级的输出分支满足所述预设倍数的关系；取后三级的输出分支输出输入至FPN网络模型中，并对后三级的输出分支设置输出量，以确定输出的旋转检测框；对于FPN网络模型的输出检测信息，进行判断，若当前为训练阶段，则通过旋转损失函数计算损失，若，当前为预测阶段，直接输出检测框。2.根据权利要求1所述的方法，其特征在于，所述检测框的设置满足：包含的信息为：类别信息c，x坐标，y坐标，长边w，短边h和旋转角度θ，其中，类别信息c表示为目标物体的类别，x坐标和y坐标分别表示图像坐标系旋转框的中心坐标，长边w表示矩形框较长的边，短边h表示矩形框较短的边，旋转角度θ表示矩形框的长边到轴逆时针旋转的夹角；采用数据增强和归一化的方法进行操作，对目标待检测的图像数据进行图像变换，增加训练数据集的数量，弥补有限数据所不能涵盖到的数据分布。3.根据权利要求2所述的方法，其特征在于，所述输入残差网络模型中并按与预设规则进行图像特征的提取，每个残差块特征图满足预设倍数的递减变换，包括：特征提取网络中的残差块数量分别为1、2、8、8和4，残差块输出的特征图大小分别为208x208，104x104，52x52，26x26和13x13，且满足2倍的递减规则，特征图大小52x52、26x26和13x13作为后三级。4.根据权利要求3所述的方法，其特征在于，取后三级的输出分支输出输入至FPN网络模型中，并对后三级的输出分支设置输出量，以确定输出的旋转检测框，包括：13x13特征图作为第一个输出分支，送入到FPN网络中，采用上采样网络处理为26x26大小，与26x26的特征图在通道维度上聚合，作为第二个输出分支；聚合后的特征图，再次使用上采样网络处理为52x52大小，与52x52的特征图在通道维度上聚合，作为第三个输出分支。5.根据权利要求4所述的方法，其特征在于，采用Darknet
‑
53为基础特征提取FPN网络模型特征，并以残差块为基础结构对输入图像进行多尺度的特征提取，数量分别为1、2、8、8和4，在每经过一部分的残差块后，图像通道数翻倍，宽高减半；对于每一个残差块，输入特征图数据为X，残差块的输出为F(x)+x，若当前残差块的目标输出为H(x)，残差块中间的卷积层需要进行拟合的函数为F(x)＝H(x)
‑
x。6.根据权利要求5所述的方法，其特征在于，所述通过旋转损失函数计算损失，包括：对坐标中心损失、宽高损失、置信度损失、类别损失和旋转角度损失，其中：角度旋转量采用二分类交叉熵损失函数，将角度分为180类，每一类表示某一整数角度且范围在[0,180)之间；每一个输出分支设置输出量，由4部分元素构成，表示每个先验框的置信度、偏移量、类别概率c和旋转角度；FPN网络模型输出通道数为3
×
(1+4+c+180)，设(c
x
,...

【专利技术属性】
技术研发人员：郑欣悦，邱佳月，王东京，张锋，高伟林，
申请(专利权)人：苏州长风航空电子有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人