基于增强特征Yolo的目标旋转检测方法技术

技术编号:37668562 阅读:9 留言:0更新日期:2023-05-26 04:28
本发明专利技术的基于增强特征Yolo的目标旋转检测方法,属于人工智能的技术领域。获取目标待检测的图像数据,通过预设的检测框进行预处理,随机地应用在自然图像上,生成随机化后的图像数据;预处理后的每张图像,输入残差网络模型中并按预设规则进行图像特征的提取,每个残差块特征图满足预设倍数的递减变换,且分为多个输出分支,每个输出分支与上一级的输出分支满足所述预设倍数的关;取后三级的输出分支输出输入至FPN网络模型中,并对后三级的输出分支设置输出量,以确定输出的旋转检测框;对于FPN网络模型的输出检测信息,进行判断,若当前为训练阶段,计算损失,若,当前为预测阶段,直接输出检测框,从而提高检测的效率。从而提高检测的效率。从而提高检测的效率。

【技术实现步骤摘要】
基于增强特征Yolo的目标旋转检测方法


[0001]本专利技术属于人工智能领域,尤其涉及一种基于增强特征Yolo的目标旋转检测方法。

技术介绍

[0002]目标检测是无人设备视觉感知中的重要任务之一,其主要功能是在二维平面图像上确定待检测类别目标的坐标位置。随着计算设备计算能力的提升,自2012年起,基于深度学习的目标检测方法逐渐流行,其主要包含单阶段目标检测和两阶段目标检测,其中:
[0003]单阶段目标检测的检测速度较快,而两阶段目标检测的检测精度较高。单阶段目标检测算法主要有YOLO(You Only Look Once)和SSD(Single Shot MultiBox Detector),其能够在神经网络特征提取的基础上直接输出检测框的位置信息和类别信息;
[0004]两阶段目标检测算法主要有R

CNN,Fast R

CNN,Faster R

CNN和R

FCN,该类方法将目标检测任务分为两个阶段,第一阶段生成候选框,第二阶段对候选框进行调整并生成类别。
[0005]然而,当前主流的目标检测方法主要应用于水平目标检测任务,即检测框为具有一定大小的水平矩形框。在实际的应用场景中,目标物体的排列方式为任意旋转角度,且在特定条件下排列较为密集,若依然采用水平目标检测方法,会造成最终检测性能的下降,存在误检测和漏检测的情况,导致检测效率较低。

技术实现思路

[0006]有鉴于此,本专利技术提供一种基于增强特征Yolo的目标旋转检测方法,解决现有技术中的检测方法存在误检测和漏检测问题,致使检测效率较低的技术问题。
[0007]一种基于增强特征Yolo的目标旋转检测方法,所述方法包括:获取目标待检测的图像数据,通过预设的检测框进行预处理;
[0008]预处理后的每张图像,输入残差网络模型中并按与预设规则进行图像特征的提取,每个残差块特征图满足预设倍数的递减变换,且分为多个输出分支,每个输出分支与上一级的输出分支满足所述预设倍数的关;
[0009]取后三级的输出分支输出输入至FPN网络模型中,并对后三级的输出分支设置输出量,以确定输出的旋转检测框;
[0010]对于FPN网络模型的输出检测信息,进行判断,若当前为训练阶段,则通过旋转损失函数计算损失,若,当前为预测阶段,直接输出检测框。
附图说明
[0011]为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0012]图1是目标检测整体网络架构示意图;
[0013]图2是主干特征提取网络架构示意图;
[0014]图3是残差块神经网络示意图。
[0015]有益效果
[0016]终端模块(数据流向的终点)为起点进行逆向遍历探寻,当遍历至次级模块故障时,则路由至另一显示单元次级模块,否则继续遍历本单元模块,以此类推,直至遍历完最后一个模块,规划一条完整的数据流向路径,同时系统管理通过监控总线告知模块开启重构通道,完成重构,逆向遍历路径规划的有益效果为正向路径计算量大,硬件成本高,且系统调度复杂,通过逆向遍历能够快速寻找唯一传输路径。
具体实施方式
[0017]下面结合附图对本公开实施例进行详细描述。
[0018]以下通过特定的具体实例说明本公开的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本公开的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
[0019]要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。
[0020]如图1所示的基于增强特征Yolo的目标旋转检测方法,尤其适用于当前Yolov3的版本进行检测,所述方法包括:
[0021]S101:获取目标待检测的图像数据,通过预设的检测框进行预处理,具体的:预处理的目的是:随机地应用在所获取的图像数据上,生成随机化后的图像数据,便于后续所使用神经网络模型的图像数据识别和格式调整,例如,调整所获取图像数据的尺寸或色调等;
[0022]检测框的设置满足:其包含的信息为:类别信息c,x坐标,y坐标,长边w,短边h和旋转角度θ,其中,类别信息c表示为目标物体的类别,x坐标和y坐标分别表示图像坐标系旋转框的中心坐标,长边w表示矩形框较长的边,短边h表示矩形框较短的边,旋转角度θ表示矩形框的长边到轴逆时针旋转的夹角,该旋转检测任务采用的数据增强方法有:水平翻转、随机扩展、随即裁剪、随机光度畸变等方式,最终将图像缩放为神经网络所需输入大小,并且,采用数据增强和归一化的方法进行操作,对目标待检测的图像数据进行图像变换,增加训练数据集的数量,弥补有限数据所不能涵盖到的数据分布。
[0023]为输入到神经网络模型之前做好基础数据,对图像进行缩放,本专利技术采用的输入
图像分辨率为416x416。对于训练数据中的检测框进行旋转表示,每一个检测框的元素为(x,y,w,h,θ),作为后续计算当前批次数据损失的标签。
[0024]S102:预处理后的每张图像,输入残差网络模型中并按与预设规则进行图像特征的提取,每个残差块特征图满足预设倍数的递减变换,且分为多个输出分支,每个输出分支与上一级的输出分支满足预设倍数的关系或变化,具体的:
[0025]特征提取网络中的残差块数量分别为1、2、8、8和4,残差块输出的特征图大小分别为208x208,104x104,52x52,26x26和13x13,且满足2倍的递减规则,特征图大小52x52、26x26和13x13作为后三级。如图3所示,采用Darknet

53为基础特征提取FPN网络模型特征,并以残差块为基础结构对输入图像进行多尺度的特征提取,数量分别为1、2、8、8和4,在每经过一部分的残差块后,图像通道数翻倍,宽高减半。对于每一个残差块,输入特征图数据为X,残差块的输出为F本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于增强特征Yolo的目标旋转检测方法,其特征在于,所述方法包括:获取目标待检测的图像数据,通过预设的检测框进行预处理;预处理后的每张图像,输入残差网络模型中并按与预设规则进行图像特征的提取,每个残差块特征图满足预设倍数的递减变换,且分为多个输出分支,每个输出分支与上一级的输出分支满足所述预设倍数的关系;取后三级的输出分支输出输入至FPN网络模型中,并对后三级的输出分支设置输出量,以确定输出的旋转检测框;对于FPN网络模型的输出检测信息,进行判断,若当前为训练阶段,则通过旋转损失函数计算损失,若,当前为预测阶段,直接输出检测框。2.根据权利要求1所述的方法,其特征在于,所述检测框的设置满足:包含的信息为:类别信息c,x坐标,y坐标,长边w,短边h和旋转角度θ,其中,类别信息c表示为目标物体的类别,x坐标和y坐标分别表示图像坐标系旋转框的中心坐标,长边w表示矩形框较长的边,短边h表示矩形框较短的边,旋转角度θ表示矩形框的长边到轴逆时针旋转的夹角;采用数据增强和归一化的方法进行操作,对目标待检测的图像数据进行图像变换,增加训练数据集的数量,弥补有限数据所不能涵盖到的数据分布。3.根据权利要求2所述的方法,其特征在于,所述输入残差网络模型中并按与预设规则进行图像特征的提取,每个残差块特征图满足预设倍数的递减变换,包括:特征提取网络中的残差块数量分别为1、2、8、8和4,残差块输出的特征图大小分别为208x208,104x104,52x52,26x26和13x13,且满足2倍的递减规则,特征图大小52x52、26x26和13x13作为后三级。4.根据权利要求3所述的方法,其特征在于,取后三级的输出分支输出输入至FPN网络模型中,并对后三级的输出分支设置输出量,以确定输出的旋转检测框,包括:13x13特征图作为第一个输出分支,送入到FPN网络中,采用上采样网络处理为26x26大小,与26x26的特征图在通道维度上聚合,作为第二个输出分支;聚合后的特征图,再次使用上采样网络处理为52x52大小,与52x52的特征图在通道维度上聚合,作为第三个输出分支。5.根据权利要求4所述的方法,其特征在于,采用Darknet

53为基础特征提取FPN网络模型特征,并以残差块为基础结构对输入图像进行多尺度的特征提取,数量分别为1、2、8、8和4,在每经过一部分的残差块后,图像通道数翻倍,宽高减半;对于每一个残差块,输入特征图数据为X,残差块的输出为F(x)+x,若当前残差块的目标输出为H(x),残差块中间的卷积层需要进行拟合的函数为F(x)=H(x)

x。6.根据权利要求5所述的方法,其特征在于,所述通过旋转损失函数计算损失,包括:对坐标中心损失、宽高损失、置信度损失、类别损失和旋转角度损失,其中:角度旋转量采用二分类交叉熵损失函数,将角度分为180类,每一类表示某一整数角度且范围在[0,180)之间;每一个输出分支设置输出量,由4部分元素构成,表示每个先验框的置信度、偏移量、类别概率c和旋转角度;FPN网络模型输出通道数为3
×
(1+4+c+180),设(c
x
,...

【专利技术属性】
技术研发人员:郑欣悦邱佳月王东京张锋高伟林
申请(专利权)人:苏州长风航空电子有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1