【技术实现步骤摘要】
本专利技术涉及计算机视觉,尤其涉及一种基于稳定扩散模型的电力设备缺陷增强和生成方法及系统。
技术介绍
1、在电力巡视缺陷检测领域,训练高性能的缺陷检测模型依赖于大量具备代表性和多样性的缺陷样本数据。然而,缺陷样本数据集的构建存在诸多挑战,严重制约了模型的训练与应用。首先,在许多电力设备场景中缺陷样本极为稀缺,尤其是某些特定场景下的设备缺陷更是难以获得,导致数据规模难以满足模型训练和优化的需求。其次,电力设备往往处于高压或超高压环境中,数据采集过程对人员的安全性提出了严苛要求,同时采集设备的部署和操作也存在较高难度。最后,电力设备缺陷数据集的类别分布普遍呈现高度不均衡分布,某些常见缺陷类别样本占据了大部分数据,而稀有缺陷类别样本数量极为稀缺。这种样本分布的不均衡性直接导致模型在稀缺缺陷类别上的检出率较低,严重限制了模型的性能实际应用效果。
2、现有的缺陷数据扩充与生成方法存在明显局限性,难以有效解决上述问题。传统的直接缺陷粘贴方法通过从原始样本中抠取缺陷区域并粘贴到新的样本中,这虽然可以增加带缺陷样本的数量,但缺陷与背景图像的
...【技术保护点】
1.一种基于稳定扩散模型的电力设备缺陷增强和生成方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于稳定扩散模型的电力设备缺陷增强和生成方法,其特征在于,具体包括以下步骤:
3.根据权利要求1所述的一种基于稳定扩散模型的电力设备缺陷增强和生成方法,其特征在于,在步骤S3中,训练语言文本模型MClip包含一个图片编码器Image encoder和一个文本编码器Text encoder,采取经典双塔模型架构。
4.根据权利要求3所述的一种基于稳定扩散模型的电力设备缺陷增强和生成方法,其特征在于,从缺陷图像集Dimage和缺陷类
...【技术特征摘要】
1.一种基于稳定扩散模型的电力设备缺陷增强和生成方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于稳定扩散模型的电力设备缺陷增强和生成方法,其特征在于,具体包括以下步骤:
3.根据权利要求1所述的一种基于稳定扩散模型的电力设备缺陷增强和生成方法,其特征在于,在步骤s3中,训练语言文本模型mclip包含一个图片编码器image encoder和一个文本编码器text encoder,采取经典双塔模型架构。
4.根据权利要求3所述的一种基于稳定扩散模型的电力设备缺陷增强和生成方法,其特征在于,从缺陷图像集dimage和缺陷类别描述文本集dtext和中随机采样样本,当采样图片样本和描述文本匹配则视为正样本,不匹配则视为负样本;然后将取出的正负样本通过图片编码器和文本编码器编码对特征向量线性投影和l2归一化,最终得到图片embedding向量和文本embedding向量;最后,使用余弦相似度得到图片embedding向量和文本embedding向量的相似度矩阵,再通过图像到文本交叉熵损失和文本到图像的交叉熵损失函数训练优化clip模型;所述的相似度矩阵s的计算:
5.根据权利要求2所述的一种基于稳定扩散模型的电力设备缺陷增强和生成方法,其特征在于,在步骤s4中,将图像数据从像素空间映射到隐向量空间是用auto encoder自编码器把输入图片从像素空间映射到隐向...
【专利技术属性】
技术研发人员:匡鹏晖,何文伟,
申请(专利权)人:深圳市莱达四维信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。