【技术实现步骤摘要】
一种适用于电力场景目标检测的预训练方法及系统
[0001]本专利技术涉及计算机视觉
,尤其涉及一种适用于电力场景目标检测的预训练方法及系统。
技术介绍
[0002]近年来,在训练模型的算力和数据都很有限的情况下,从头训练目标检测器是很困难的,尤其是对于小数据集。因此,对目标检测器进行预训练是非常重要的。预训练技术是指从已经训练好的模型中构建新架构的技术。预训练使得模型已经拥有一定的提取特征能力,应用预训练技术可以更快地提高算法性能。
[0003]但是,现有的基于深度学习的目标检测预训练技术大多数是基于有监督的方法。有监督的预训练技术在收集到的带有标注的大规模电力场景数据集上进行预训练。然而,大规模的电力场景数据集的标注是非常昂贵并且耗费时间的,
技术实现思路
[0004]本部分的目的在于概述本专利技术的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和专利技术名称中可能会做些简化或省略以避免使本部分、说明书摘要和专利技术名称的目的模糊,而这种简化或省略不能用于限制本专利
【技术保护点】
【技术特征摘要】
1.一种适用于电力场景目标检测的预训练方法,其特征在于,包括:获取清晰电力场景图像数据集,所述清晰电力场景图像数据集无需人工标注;在对无标签的图像进行不同的预处理后,将预处理后的图像输入到多个编码器中,设计多种损失函数对编码器的输出进行运算,使编码器能从大量无标签的电力场景图像中提取特征,最终得到用于电力场景的目标检测任务的预训练模型;使用有标签的电力场景目标检测数据集对预训练模型进行微调后,得到目标检测模型。2.如权利要求1所述的适用于电力场景目标检测的预训练方法,其特征在于:所述编码器网络包括编码器M和动量编码器ME,所述编码器网络的训练方法包括以下步骤:获取清晰电力场景图像数据集,所述清晰电力场景图像数据集无需人工标注,将清晰的电力场景图像进行旋转、灰度、按不同尺度进行裁剪的图像预处理操作;获取的预处理图像随机混淆输入到动量编码器ME,将未进行随机混淆的预处理图像输入到编码器M,对动量编码器ME和编码器M的输出进行不同层级的对比损失函数运算,从而更新编码器网络中的编码器M和动量编码器ME;重复多轮次的更新编码器操作,使得编码器M和动量编码器ME能准确识别各自的输入来自于相同的图像。3.如权利要求1或2所述的适用于电力场景目标检测的预训练方法,其特征在于:所述动量编码器ME和编码器E的输入图像是同一张图像经过不同的预处理后的图像,其中预处理的操作,主要包括:图像灰度化、图像裁剪、图像旋转、图像多尺度分块、图像缩放。4.如权利要求3所述的适用于电力场景目标检测的预训练方法,其特征在于:所述动量编码器ME和编码器E的输入图像具有特殊的设定,包括:动量编码器ME的输入图像会在图像预处理的基础上引入随机因素,具体操作有:在图像多尺度分块的基础上将分块打乱作为输入数据;图像裁剪后只保留图像中的目标的部分特征作为输入数据;编码器E的输入图像将使用对原图的目标特征只做较小的改变的预处理后图像,具体预处理有:图像灰度化、图像旋转、图像缩放以及多尺度分块后保留原本的图像分布顺序。5.如权利要求4所述的适用于电力场景目标检测的预训练方法,其特征在于:所述编码器E提取对应输入图像的特征作为query,动量编码器ME提取对应输入图像的特征作为key,再对两个特征进行全局和局部的对比损失运算;在获取到对比损失后会进行参数更新,动量编码器ME...
【专利技术属性】
技术研发人员:徐一丹,杨宇,刘文松,罗旺,张海全,胡竹青,刘雪菁,顾宇,张伟,张锦辉,滕家雨,殷翌航,俞俊,
申请(专利权)人:国电南瑞科技股份有限公司国网电力科学研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。