【技术实现步骤摘要】
基于尺度上下文的变电站图像目标检测方法
[0001]本专利技术属于变电站检测
,涉及一种基于尺度上下文的变电站图像目标检测方法。
技术介绍
[0002]传统的目标检测算法包括选取候选框、表征提取和分类器判定三个阶段。选取候选框阶段的任务是提取图像中可能包含目标的区域位置,即感兴趣区域(Region of Interest,RoI)。基本思想是先用不同尺寸的窗口滑动扫描整幅图像,判断每个窗口中是否含有目标,将含有目标的窗口作为候选框。特征提取阶段,利用滑动窗口在图像的每个区域上取得特定长度的表征向量,从而捕获该区域的语义判别信息。由于图像目标存在视角多元、光线变化和背景复杂等问题,因此难以设计鲁棒性强的特征提取模型来描述不同条件下的目标特征。分类器判定阶段,目的是为候选框分配类别标签。
[0003]视觉对象出现在特定的环境中,且通常与其他相关目标共存。人类视觉进行目标识别任务的优势,很大程度上依赖于上下文信息。上下文信息在计算机视觉的目标检测任务中,也起到至关重要的作用。上下文信息能够在一定程度上消除检测的不确定性,减少歧义,增强检测结果的可靠性。适当地对上下文信息进行建模,有助于目标识别与定位,尤其是当目标的外观特征不足时,例如目标尺寸小、受遮挡或图像质量差的情况。为了充分挖掘数据之间的关联,近年来,基于上下文信息的目标检测方法成为了检测领域的研究热点。
[0004]基于深度学习的目标检测技术,在电力领域的红外图像和可见光图像中都得到了广泛应用。然而,电力设备具有尺度多样性的特点,大小尺寸、高宽 ...
【技术保护点】
【技术特征摘要】
1.一种基于尺度上下文的变电站图像目标检测方法,其特征是,包括以下步骤:步骤一、数据预处理:采用基于仿射变换的数据增强和随机增强策略完成数据集扩充,得到数据增强后的训练集;步骤二、特征提取:采用经过预训练的VGG
‑
16模型作为特征提取网络,每张输入图像在一系列卷积及池化后,得到不同尺寸的卷积特征图;步骤三、提取感兴趣区域:使用区域提名网络进行候选框提取,得到感兴趣区域;区域提名网络首先对特征提取网络的最后一层卷积特征图进行滑窗操作,在每个窗口的中心位置生成一系列锚框;利用基于K
‑
means的锚框尺度制定策略,通过对训练集标注文件中矩形包围框的长、宽进行于K
‑
means聚类得到数据分布,从而调整锚框尺度;步骤四、多尺度特征融合:将感兴趣区域映射到特征提取网络的卷积特征图上,并对其对应区域进行感兴趣区域池化,再通过两层全连接层,输出融合特征;步骤五、分类和定位:对输出的融合特征进行分类和定位,在分类时,采用Soft
‑
NMS算法去除冗余框。2.根据权利要求1所述的基于尺度上下文的变电站图像目标检测方法,其特征是,所述VGG
‑
16模型包括6层卷积池化层,依次为:Conv1_3层、Conv2_3层、Conv3_3、Conv4_3层、Conv5_3层、Conv6_3层,输入图像在进行6组卷积、池化操作后,得到不同尺寸的卷积特征图。3.根据权利要求2所述的基于尺度上下文的变电站图像目标检测方法,其特征是,步骤三中,在Conv5_3输出的卷积特征图上,利用区域提名网络进行候选框提取,得到感兴趣区域,通过感兴趣区域池化层将感兴趣区域坐标分别映射到不同层级的卷积特征图上,得到对应区域的RoI映射卷积特征图。4.根据权利要求3所述的基于尺度上下文的变电站图像目标检测方法,其特征是,步骤四中,将Conv4_3层和Conv5_3层的RoI映射卷积特征图分别作为第一全连接层的输入,进行一次全连接操作,得到两个1
×1×
2048的特征向量,然后拼接成为一个1
×1×
4096的融合特征,再经过第二全连接层,输出到分类回归网络进行最终的分类和定位。5.根据权利要求4所述的基于尺度上下文的变电站图像目标检测方法,其特征是,步骤五中,Soft
‑
NMS算法的重评分过程用一个连续的罚函数来表达,在预测框不重叠的情况下不惩罚,在高重叠情况下有很高的惩罚,将置信度构建为关于交并比的函数:其中,s
i
表示当前预测框的置信度评分,IoU(B,b
i
)表示预测框b
i
与评分最大框B的面积交并比,P表示最终预测框的集合,e为自然对数,σ为罚函数系数。6.根据权利要求1所述的基于尺度上下文的变电站图像目标检测方法,其特征是,步骤一中,采用的主要仿射变换方式包括:缩放、旋转、翻转、平移、尺度变换以及插值;为了扩大设备矩形包围框尺寸的范围,将图像...
【专利技术属性】
技术研发人员:徐波,李福德,李志坤,钟成,夏祥波,林谋,
申请(专利权)人:国家电网有限公司珠高智能科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。