一种基于扩散模型的变电站光缆图智能解析方法、装置及存储介质制造方法及图纸

技术编号：41381755 阅读：5 留言：0更新日期：2024-05-20 10:23

本发明专利技术提出一种基于扩散模型的变电站光缆图智能解析方法、装置及存储介质，包括：对待识别的变电站光缆图进行预处理，获得处理后的图纸；标注处理后的图纸数据，构建训练集、验证集和测试集；构建图元检测模型，使用基于Swin transformer和EFPN网络的主干网络，并在解码器中加入CBAM注意力机制；训练集训练构建的图元检测模型，验证集进行最佳模型选择，得到训练后的图元检测模型；将测试集的图纸输入训练好的图元检测模型和字符识别模型；将图元检测结果和字符识别结果进行匹配，输出最终结果。采用在扩散模型基础上进一步修改DiffusionDet网络结构的目标检测方法，并提出融合拓扑匹配和聚类分析的配对算法，使得变电站光缆图的解析工作更加智能高效且具有较好的可迁移性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像处理，具体涉及一种基于扩散模型的变电站光缆图智能解析方法、装置及存储介质。

技术介绍

1、变电站光缆图是用于描述变电站内部以及变电站与外部通信网络之间光缆的布置和连接情况的图纸，是变电站运行和维护的重要参考资料。在其应用场景中，技术人员需要依据图纸的光缆连接信息得到相应端口之间的配对情况，费时费力且出错的可能性较高，工作效率较低。

2、随着人工智能、深度学习的发展，“智能电网”、“数字电网”概念也逐渐推广与普及，传统依赖人工的图纸识别形式已经难以满足当前电网系统正常运行、扩建、检测的需要。因此智能化解析图纸信息、自动化结构化输出光缆连接信息相应端口之间的配对情况的需求迫在眉睫。

3、在使用目标检测的图纸解析任务中，检测和识别是最为关键的两步。识别的部分依赖于目前成熟的算法例如crnn等已经起到较好的效果，且依赖于当下主流公司针对表格文本的训练结果，对文本的识别工作的准确度已经达到了很高的水准。但是图纸解析中特定的任务场景对于检测带来了挑战，具体如下：

4、1、当前目标检测算法可以检测到光缆图中关键图元的信息，但不同于传统任务场景的目标检测，图纸结构复杂，图元往往较小且数量很多，难以准确识别和分割出关键信息，对检测的精确度提出了很高的要求。

5、2、图纸解析任务需要不断训练图中的关键图元信息以获得更好的检测效果，但往往需要训练很多的参数，训练成本较高。

6、3、图纸的风格和格式可能因行业、设计标准或个人偏好而有所不同，这可能使得训练的检测模型在识别不同风

7、综上可知，尽管现有的目标检测方法已经广泛应用于图纸解析的领域并且取得一定效果，但由于小目标带来的检测难题、训练成本高和迁移性差等问题，有必要针对变电站光缆图提出一套检测精度高且实用性强的智能解析方案。

技术实现思路

1、本专利技术所要解决的技术问题是针对现有技术中存在的缺陷，提出一种基于扩散模型的变电站光缆图智能解析方法、装置及存储介质。本专利技术提高变电站光缆图纸中小目标检测的准确性且能精确地解析出光缆图中端口配对结果。

2、为实现上述目的，在上述技术方案的基础上，本专利技术提供如下技术方案：

3、一种基于扩散模型的变电站光缆图智能解析方法，包括以下步骤：

4、步骤1，对待识别的变电站光缆图进行预处理，获得处理后的图纸，对处理后的图纸数据进行标注，构建训练集、验证集和测试集；

5、步骤2，构建基于扩散模型的图元检测模型，使用基于swin transformer和efpn网络的主干网络作为图像编码器，并在解码器中加入cbam注意力机制；

6、步骤3，用训练集训练构建的图元检测模型，并用验证集进行最佳模型选择，得到训练后的图元检测模型；

7、步骤4，将测试集的图纸输入训练好的图元检测模型和字符识别模型；

8、步骤5，使用融合拓扑匹配和聚类分析的配对算法对图元检测结果和文本识别结果进行匹配，输出最终配对结果。

9、进一步的，所述步骤1，预处理包括：依次对待识别图纸进行图片格式转换、图纸方向调整、图纸大小调整和归一化处理。

10、进一步的，所述步骤2，基于扩散模型的图元检测模型包括一个图像编码器(imageencoder)和一个图像解码器(detection decoder)；

11、进一步的，所述图元包括左线缆集图元和文本图元；

12、进一步的，所述的图像编码器包括主干网络(swin transformer)和用于小目标的特征金字塔网络(efpn)。图像编码器的主要作用是从输入的原始图像中提取高级特征，并生成更加关注于小目标的多尺度特征图；

13、进一步的，图像编码器的实现步骤如下：

14、将预处理后的图纸送入swin-transformer进行特征提取，将提取后的特征图送入efpn网络生成多尺度特征图。efpn是在fpn中引入ftt(feature texture transfer)，通过结合来自不同层级的特征图，将较深层次的语义信息丰富的低分辨率特征图p3与较浅层次的高分辨率特征图p2结合，通过内容提取器提取主要语义信息，然后利用子像素卷积技术对提取的内容特征进行上采样，以增加特征图的空间分辨率,生成适用于小目标检测的高分辨率特征图p3’。

15、进一步的，所述的图像解码器包括:roi池化层，cbam自注意力机制，多个rcnn检测头，动态卷积层，时间和位置嵌入层；

16、进一步的，所述解码器的构建步骤如下：

17、步骤2-1，时间嵌入：利用时间嵌入层加入时间维度的信息，处理视频或序列图像中的动态变化。

18、步骤2-2，区域特征提取：利用传入的特征features和noisy boxes，通过roipooler提取每个区域的特征。

19、步骤2-3，空间注意力机制特征增强：将裁剪后的roi feature传入convolutionalblock attention module(cbam)，增强模型对图像特定区域的关注能力。

20、步骤2-4，自注意层：使用多头自注意力处理提出的特征增强不同区域之间的联系。

21、步骤2-5，实例交互：通过动态卷积层实现区域之间的交互。

22、步骤2-6，分类和回归预测：分别通过分类头和回归头对每个roi进行类别预测和边界框调整；

23、步骤2-7，反复迭代多次步骤2-2至2-6，输出最后的类别和边界框；

24、进一步的，所述步骤2-3，解码器中加入cbam注意力机制的具体实现如下：

25、对裁剪后的roi特征将输入的feature map经过两个并行的maxpool层和avgpool层，将特征图从c×h×w变为c×1×1的大小，然后经过share mlp模块，在该模块中，它先将通道数压缩为原来的1/r，再扩张到原通道数，经过relu激活函数得到两个激活后的结果。将这两个输出结果进行逐元素相加，再通过一个sigmoid激活函数得到通道注意力的输出结果，再将这个输出结果乘原图，变回c×h×w的大小。

26、所述通道注意力的公式如下：

27、

28、将输出结果通过最大池化和平均池化得到两个1×h×w的特征图，然后经过concat操作对两个特征图进行拼接，通过7×7卷积变为1通道的特征图，再经过一个sigmoid得到空间注意力的特征图，最后将输出结果乘原图变回c×h×w大小。

29、所述空间注意力的公式如下：

30、

31、进一步的，所述步骤3，图元检测模型训练，具体步骤包括：

32、步骤3-1，初始化一组boxes进行前向加噪，得到噪声框；

33、步骤3-2，使用编码器提取高阶空间特征；

34本文档来自技高网...

【技术保护点】

1.一种基于扩散模型的变电站光缆图智能解析方法，其特征在于：所述方法具体包括如下步骤：

2.根据权利要求书1所述的一种基于扩散模型的变电站光缆图智能解析方法，其特征在于：所述步骤1具体包括如下分步骤：

3.根据权利要求书1所述的一种基于扩散模型的变电站光缆图智能解析方法，其特征在于：所述步骤2具体包括如下分步骤：

4.根据权利要求书1所述的一种基于扩散模型的变电站光缆图智能解析方法，其特征在于：所述步骤3具体包括如下分步骤：

5.根据权利要求书1所述的一种基于扩散模型的变电站光缆图智能解析方法，其特征在于：所述步骤4中的图元检测模型的具体采样实现步骤如下：

6.根据权利要求书1所述的一种基于扩散模型的变电站光缆图智能解析方法，其特征在于：所述步骤5具体包括：运用融合拓扑匹配和聚类分析的配对算法，对图元检测结果和文本识别结果进行匹配，该算法具体实现步骤如下：

7.一种基于扩散模型的变电站光缆图智能解析装置，其特征在于：包括处理器及存储介质；

8.一种应用于基于扩散模型的变电站光缆图智能解析装置的存储

...

【技术特征摘要】

1.一种基于扩散模型的变电站光缆图智能解析方法，其特征在于：所述方法具体包括如下步骤：

2.根据权利要求书1所述的一种基于扩散模型的变电站光缆图智能解析方法，其特征在于：所述步骤1具体包括如下分步骤：

3.根据权利要求书1所述的一种基于扩散模型的变电站光缆图智能解析方法，其特征在于：所述步骤2具体包括如下分步骤：

4.根据权利要求书1所述的一种基于扩散模型的变电站光缆图智能解析方法，其特征在于：所述步骤3具体包括如下分步骤：

5.根据权利要求书1所述的一种基于扩散模型的变电站光缆图智能解析方法，其特征在...

【专利技术属性】
技术研发人员：王天祺，金重驹，林燕心，陈蕾，
申请(专利权)人：南京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人