一种基于Faster-RCNN模型的目标检测方法及系统技术方案

技术编号:39295020 阅读:20 留言:0更新日期:2023-11-07 11:02
本发明专利技术公开了一种基于Faster

【技术实现步骤摘要】
一种基于Faster

RCNN模型的目标检测方法及系统


[0001]本专利技术涉及机器学习
,并且更具体地,涉及一种基于Faster

RCNN模型的目标检测方法及系统。

技术介绍

[0002]在传统机器学习算法的推动下,目标检测无论在检测精度上还是在检测速度上都取得了极大的进步。然而,传统机器学习算法在目标检测领域还是显示出很多不足,比如传统目标检测算法中,需要人工设计特征,这要求研究人员具有优秀的先验知识,而类似算法在目标形态变化大、复杂背景或者光照不足的情况下表现往往不佳。

技术实现思路

[0003]根据本专利技术,提供了一种基于Faster

RCNN模型的目标检测方法及系统,以解决传统机器学习算法在目标检测领域还是显示出很多不足,比如传统目标检测算法中,需要人工设计特征,这要求研究人员具有优秀的先验知识,而类似算法在目标形态变化大、复杂背景或者光照不足的情况下表现往往不佳的技术问题。
[0004]根据本专利技术的第一个方面,提供了一种基于Faster本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于Faster

RCNN模型的目标检测方法,其特征在于,包括:确定输入的待测图像;利用卷积神经网络对所述待测图像进行特征提取,生成特征图;利用候选区域生成网络对所述特征图进行处理并输出多种尺度和宽高比的目标候选区域;利用分类回归网络,根据所述目标候选区域内的特征进行判别输出,确定输出结果。2.根据权利要求1所述的方法,其特征在于,利用候选区域生成网络对所述特征图进行处理并输出多种尺度和宽高比的目标候选区域,包括:根据待测图像中的边缘、纹理和颜色,生成目标候选区域,即图像中可能包含待测目标的区域;以特征图作为输入,使用一个滑动窗口在特征图上进行滑动,将滑动窗口经过的每个位置上的特征映射成一个256维的特征向量,将每个特征向量输入到两个全连接层当中,一个全连接层输出2
×
9=18个分数,另一个全连接层输出4
×
9=36个修正参数;利用修正参数对基准矩形框进行修正,每个基准矩形框分别对应4个修正参数,每个滑动窗口位置得到9个候选区域,上述18个分数为候选区域的评分,每个候选区域对应2个分数,分别代表该候选区域内包含和不包含待测目标的可能性。3.根据权利要求2所述的方法,其特征在于,利用候选区域生成网络对所述特征图进行处理并输出多种尺度和宽高比的目标候选区域,还包括:对于每个基准矩形框会输出4个修正参数tx,ty,tw,th,利用这4个修正参数对基准矩形框进行修正即可得出候选区域,下列公式为基准矩形框的修正公式:x=w
a
t
x
+x
a
y=h
a
t
y
+y
a
w=w
a
exp(t
w
)h=h
a
exp(t
h
)式中,x,y,w,h表示候选区域的中心横坐标、中心纵坐标、宽度、高度。4.根据权利要求1所述的方法,其特征在于,利用分类回归网络,根据所述目标候选区域内的特征进行判别输出,确定输出结果,包括:以特征提取网络输出的特征图和候选区域生成网络输出的目标候选区域为输入,输出候选区域对应各类别的置信度和修正参数,修正参数用于对目标候选区域进行修正。5.根据权利要求4所述的方法,其特征在于,还包括:分类回归网络的损失函数是一个多任务损失函数,下式为分类回归网络的损失函数的表达式:L(p,u,v
u
,v
*
)=L
cls
(p,u)+λ[u≥1]L
loc
(v
u
,v
*
)式中,p是一个由各类别置信度组成的向量,p=(p0,p1,p2,

,pk),pi为候选区域为第i类的置信度,u是候选区域的标签,vu为候选区域的预测修正参数,v*是候选区域相对于目标标签框的修正参数,λ用于调节两个子项的相对重要程度。6.一种基于Faster

【专利技术属性】
技术研发人员:王佳颖李玉容吴建雄武艺彭涛
申请(专利权)人:国网电力空间技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1