一种基于动态Anchor选择的目标检测方法技术

技术编号:36201281 阅读:52 留言:0更新日期:2023-01-04 11:55
本发明专利技术提供了目标检测技术领域的一种基于动态Anchor选择的目标检测方法,包括如下步骤:步骤S10、获取大量的图像,并对各所述图像进行标注以构建图像数据集;步骤S20、基于随机B l ock数据替换对所述图像数据集进行样本扩充;步骤S30、基于FPN模块以及动态Anchor选择模块构建目标检测模型;步骤S40、利用所述图像数据集对目标检测模型进行训练;步骤S50、利用训练后的所述目标检测模型进行目标检测。本发明专利技术的优点在于:极大的提升了目标检测的准确率。率。率。

【技术实现步骤摘要】
一种基于动态Anchor选择的目标检测方法


[0001]本专利技术涉及目标检测
,特别指一种基于动态Anchor选择的目标检测方法。

技术介绍

[0002]随着计算机技术的发展和计算机视觉原理的广泛应用,利用计算机图像处理技术对目标进行实时跟踪检测的研究也越来越热门,对目标进行动态实时跟踪定位在智能化交通系统、智能监控系统、军事目标检测以及医学导航手术中手术器械的定位等方面具有广泛的应用价值。
[0003]基于图像(图片信息)构建目标检测模型是进行目标检测的有效方法,将摄像头获取的图像输入目标检测模型,能够实时检测到图像中存在的目标,为后续的下游任务提供检测结果。
[0004]然而,传统的目标检测依旧存在一些问题,主要表现在:1、图像的样本量较少,影响目标检测模型的训练效果,进而影响目标检测的准确率;2、传统的目标检测模型容易对小目标漏检,且无法对画质较为模糊的图像进行有效检测;3、聚类生成的Anchor尺寸比例不能覆盖全部的尺寸比例,进而导致检测出来的矩形框对目标进行框选的效果一般;4、对少数类别图像的目标检测的检测效果较差。
[0005]因此,如何提供一种基于动态Anchor选择的目标检测方法,实现提升目标检测的准确率,成为一个亟待解决的技术问题。

技术实现思路

[0006]本专利技术要解决的技术问题,在于提供一种基于动态Anchor选择的目标检测方法,实现提升目标检测的准确率。
[0007]本专利技术是这样实现的:一种基于动态Anchor选择的目标检测方法,包括如下步骤:
[0008]步骤S10、获取大量的图像,并对各所述图像进行标注以构建图像数据集;
[0009]步骤S20、基于随机Block数据替换对所述图像数据集进行样本扩充;
[0010]步骤S30、基于FPN模块以及动态Anchor选择模块构建目标检测模型;
[0011]步骤S40、利用所述图像数据集对目标检测模型进行训练;
[0012]步骤S50、利用训练后的所述目标检测模型进行目标检测。
[0013]进一步地,所述步骤S10具体为:
[0014]获取大量的图像,并对各所述图像进行目标以及图像类别的标注,基于标注后的各所述图像构建图像数据集。
[0015]进一步地,所述步骤S20具体包括:
[0016]步骤S21、从所述图像数据集选取第一比例的图像作为待增强图像;
[0017]步骤S22、分别从各所述待增强图像中随机抽取一个目标作为待增强目标;
[0018]步骤S23、分别从各所述待增强目标中,抽取大小为所述待增强目标的第二比例的
随机Block,从各所述随机Block中随机选取一个像素点,获取该像素点的RGB值pixel;
[0019]步骤S24、从(255

pixel)、0、pixel、255这四个值中,随机选取一个作为整个所述随机Block的RGB值,得到纯色Block;
[0020]步骤S25、将各所述纯色Block与对应的待增强图像进行合并,进而得到训练数据;
[0021]步骤S26、基于RGB更新公式对所述训练数据的RGB值进行更新,进而得到增强图像,基于各所述增强图像扩充图像数据集的样本。
[0022]进一步地,所述步骤S26中,所述RGB更新公式具体为:
[0023]w
t
=0.8*Δw
待增强图像
+0.2*Δw
随机策略
+w
t
‑1;
[0024]其中,w
t
表示t轮更新的RGB值;w
t
‑1表示t

1轮更新的RGB值;0.8和0.2分别表示待增强图像和纯色Block的权重;Δw
待增强图像
表示待增强图像计算出来的RGB增量;Δw
随机策略
表示纯色Block计算出来的RGB增量。
[0025]进一步地,所述步骤S30中,所述FPN模块用于执行如下步骤:
[0026]步骤S311、从所述图像数据集中获取各图像的宽高s*s以及通道数C;
[0027]步骤S312、将所述图像作为原始特征图F1,并随机分解成子特征图F2、子特征图F8、子特征图F14,分别代表分解后的位置、置信度以及类别预测值;
[0028]步骤S313、由FPN模块直接基于所述原始特征图F1生成子特征图F6、子特征图F12、子特征图F18,分别代表直接生成的位置,置信度以及类别;
[0029]步骤S314、由FPN模块基于所述原始特征图F1生成通道数为2的子特征图F3,将所述子特征图F3分解为子特征图F4和子特征图F5;所述子特征图F4和子特征图F5对应的元素和为1,分别用于代表子特征图F2和子特征图F6的权重;
[0030]由FPN模块基于所述原始特征图F1生成通道数为2的子特征图F9,将所述子特征图F9分解为子特征图F10和子特征图F11;所述子特征图F10和子特征图F11对应的元素和为1,分别用于代表子特征图F8和子特征图F12的权重;
[0031]由FPN模块基于所述原始特征图F1生成通道数为2的子特征图F15,将所述子特征图F15分解为子特征图F16和子特征图F17;所述子特征图F16和子特征图F17对应的元素和为1,分别用于代表子特征图F14和子特征图F18的权重;
[0032]步骤S315、将所述子特征图F2和子特征图F4逐元素相乘,加上所述子特征图F6和子特征图F5逐元素相乘,得到子特征图F7,用于对位置的信息进行分解再融合;
[0033]将所述子特征图F8和子特征图F10逐元素相乘,加上所述子特征图F12和子特征图F11逐元素相乘,得到子特征图F13,用于对置信度的信息进行分解再融合;
[0034]将所述子特征图F14和子特征图F16逐元素相乘,加上所述子特征图F18和子特征图F17逐元素相乘,得到子特征图F19,用于对类别的信息进行分解再融合;
[0035]步骤S316、对所述子特征图F7、子特征图F13和子特征图F19做concat操作得到特征图F20,所述特征图F20和原始特征图F1的通道数一致,并包含了独立的位置,置信度以及类别。
[0036]进一步地,所述步骤S311中,所述通道数C的计算公式为:
[0037]C=1+4+n;
[0038]其中,1表示目标的置信度,4表示目标中心点的坐标和宽高,n表示目标的类别数。
[0039]进一步地,所述步骤S30中,所述动态Anchor选择模块用于执行如下步骤:
[0040]步骤S321、将所述图像数据集中的图像均分为9份,用Part_i表示,i=1,2,

,9;
[0041]步骤S322、分别对各所述Part_i进行Anchor聚类,得到聚类结果Anchors_i,i=1,2,

,9;
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于动态Anchor选择的目标检测方法,其特征在于:包括如下步骤:步骤S10、获取大量的图像,并对各所述图像进行标注以构建图像数据集;步骤S20、基于随机Block数据替换对所述图像数据集进行样本扩充;步骤S30、基于FPN模块以及动态Anchor选择模块构建目标检测模型;步骤S40、利用所述图像数据集对目标检测模型进行训练;步骤S50、利用训练后的所述目标检测模型进行目标检测。2.如权利要求1所述的一种基于动态Anchor选择的目标检测方法,其特征在于:所述步骤S10具体为:获取大量的图像,并对各所述图像进行目标以及图像类别的标注,基于标注后的各所述图像构建图像数据集。3.如权利要求1所述的一种基于动态Anchor选择的目标检测方法,其特征在于:所述步骤S20具体包括:步骤S21、从所述图像数据集选取第一比例的图像作为待增强图像;步骤S22、分别从各所述待增强图像中随机抽取一个目标作为待增强目标;步骤S23、分别从各所述待增强目标中,抽取大小为所述待增强目标的第二比例的随机Block,从各所述随机Block中随机选取一个像素点,获取该像素点的RGB值pixel;步骤S24、从(255

pixel)、0、pixel、255这四个值中,随机选取一个作为整个所述随机Block的RGB值,得到纯色Block;步骤S25、将各所述纯色Block与对应的待增强图像进行合并,进而得到训练数据;步骤S26、基于RGB更新公式对所述训练数据的RGB值进行更新,进而得到增强图像,基于各所述增强图像扩充图像数据集的样本。4.如权利要求3所述的一种基于动态Anchor选择的目标检测方法,其特征在于:所述步骤S26中,所述RGB更新公式具体为:w
t
=0.8*Δw
待增强图像
+0.2*Δw
随机策略
+w
t
‑1;其中,w
t
表示t轮更新的RGB值;w
t
‑1表示t

1轮更新的RGB值;0.8和0.2分别表示待增强图像和纯色Block的权重;Δw
待增强图像
表示待增强图像计算出来的RGB增量;Δw
随机策略
表示纯色Block计算出来的RGB增量。5.如权利要求1所述的一种基于动态Anchor选择的目标检测方法,其特征在于:所述步骤S30中,所述FPN模块用于执行如下步骤:步骤S311、从所述图像数据集中获取各图像的宽高s*s以及通道数C;步骤S312、将所述图像作为原始特征图F1,并随机分解成子特征图F2、子特征图F8、子特征图F14,分别代表分解后的位置、置信度以及类别预测值;步骤S313、由FPN模块直接基于所述原始特征图F1生成子特征图F6、子特征图F12、子特征图F18,分别代表直接生成的位置,置信度以及类别;步骤S314、由FPN模块基于所述原始特征图F1生成通道数为2的子特征图F3,将所述子特征图F3分解为子特征图F4和子特征图F5;所述子特征图F4和子特征图F5对应的元素和为1,分别用于代表子特征图F2和子特征图F6的权重;由FPN模块基于所述原始特征图F1生成通道数为2的子特征图F9,将所述子特征图F9分解为子特征图F10和子特征图F11;所述子特征图F10和子特征图F11对应的元素和为1,分别
用于代表子特征图F8和子特征图F12的权重;由FPN模块基于所述原始特征图F1生成通道数为2的子特征图F15,将所述子特征图F15分解为子特征图F16和子特征图F17;所述子特征图F16和子特征图F17对应的元素和为1,分别用于代表子特征图F14和子特征图F18的权重;步骤S315、将所述子特征图F2和子特征图F4逐元素相乘,加上所述子特征图F6和子特征图F5逐元素相乘,得到子特征图F7,用于对位置的信息进行分解再融合;将所述子特征图F8和子特征图F10逐元素相乘,加上所述子特征图F12和子特征图F11逐元素相乘,得到子特征图F13,用于对置信度的信息进行分解再融合;将所述子特征图F14和子特征图F16逐元素相乘,加上所述子特征图F18和子特征图F17逐元素相乘,得到子特征图F19,用于对类别的信息进行分解再融合;步骤S316、对所述子特征图F7、子特征图F13和子特征图F19做concat操作得到特征图F20,所述特征图F20和原始特征图F1的通道数一致,并包含了独立的位置,置信度以及类别。6.如权利要求5所述的一种基于动...

【专利技术属性】
技术研发人员:张西朱坚林克
申请(专利权)人:福建新大陆软件工程有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1