基于端到端的深度学习的P&ID图纸识别与重建系统技术方案

技术编号：40045691 阅读：5 留言：0更新日期：2024-01-16 20:25

本发明专利技术涉及一种基于端到端的深度学习的P&ID图纸识别与重建系统，其包括：文字识别模块，用于对原始图纸中的管线号和设备位号进行识别和储存；符号识别模块，用于对原始图纸中的符号进行识别和储存；管线识别模块，用于对原始图纸中的管线的终点和起点像素值进行识别和储存；关系识别模块，用于对原始图纸中的符号和管线的上下游逻辑关系进行识别和储存；图纸重建模块，用于基于前述各识别模块所得到的一个或多个识别结果得到重建后的待校核图纸，其中，图纸重建模块在进行重建时能够根据图神经网络预测的上下游关系对识别的管线和符号进行连接，并将未识别的管线和符号进行保留，以使得该未识别的管线和符号能够被直接发送至校核模块。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图形图像处理，尤其涉及一种基于端到端的深度学习的p&id图纸识别与重建系统。

技术介绍

1、p&id（piping and instrument diagram）是工艺管道和仪表流程图的简称，其指的是应根据工艺流程图（pfd：process flow diagram）的要求，详细地表示该系统的全部设备、仪表、管道、阀门和其他有关公用工程系统的图纸。p&id图纸的表达重点是管道的流程以及过程工艺如何控制，显示管道系统是如何将工业加工设备连接在一起的。p&id图纸还会显示用于监控物料在管道中的流动情况的仪表和阀门。化工工程的设计，从工艺包、基础设计到详细设计中的大部分阶段，p&id图纸都是化工工艺及工艺系统专业的设计中心，其他专业（设备、机泵、仪表、电气、管道、土建、安全等）都在为实现p&id图纸里的设计要求而工作。

2、大量化工企业拥有的p&id图纸都是图片格式，无法获取原始设计的p&id设计文件。随着企业数字化发展的深入，图片格式的p&id图纸需要被转化成可以编辑的矢量化图纸，传统方式是利用人工比对原始图纸，再重新设计一遍，以实现图纸的矢量化。近几年随着深度学习技术突飞猛进的发展，尤其是视觉识别领域的技术日益成熟，为p&id图纸的自动识别与重建提供了新的技术方案。

3、cn111079766a公开了一种p&id图的智能化方法，包括图形符号和文字代号识别及其属性设置步骤、连接线识别及其属性设置步骤和连接关系

4、然而现有技术基本只会对设备符号进行识别，而忽略了设备之间的上下游关系，使得重建得到的p&id图纸与原始图纸在设备的拓扑关系上存在较大差异，尤其是对于原本设备关系就较为复杂的情况。并且若仅通过识别连接线的方式来确定关联关系，在部分复杂情况下所重建得到的p&id图纸的准确性和鲁棒性都会受到较大影响，具有局限性。此外，当前的技术并不能保证对原始图纸进行百分百的还原，在识别过程中出现错误的情况无法避免，现有技术并未针对该问题提出相应的解决方案，进而影响了p&id图纸的识别和重建工作的质量和效率。此外，一方面由于对本领域技术人员的理解存在差异；另一方面由于申请人做出本专利技术时研究了大量文献和专利，但篇幅所限并未详细罗列所有的细节与内容，然而这绝非本专利技术不具备这些现有技术的特征，相反本专利技术已经具备现有技术的所有特征，而且申请人保留在
技术介绍
中增加相关现有技术之权利。

技术实现思路

1、针对现有技术之不足，本专利技术旨在提供一种基于端到端的深度学习的p&id图纸识别与重建系统，以解决现有技术中在进行p&id图纸的自动化识别和重建时所面临的至少部分问题，以使用端到端的深度学习的统一框架，最大化地减少人工的识别和干预图纸的识别和重建过程。本系统需要大量的图纸数据进行符号、关系、管线的标注，通过监督方法进行学习，让各个网络的精度达到当前最优，从而相互串联、相互配合，实现全自动的识别和重建。

2、本专利技术公开了一种基于端到端的深度学习的p&id图纸识别与重建系统，其包括：

3、文字识别模块，用于对原始图纸中的管线号和设备位号进行识别和储存；

4、符号识别模块，用于对原始图纸中的符号进行识别和储存；

5、管线识别模块，用于对原始图纸中的管线的终点和起点像素值进行识别和储存；

6、关系识别模块，用于对原始图纸中的符号和管线的上下游逻辑关系进行识别和储存；

7、图纸重建模块，用于基于文字识别模块、符号识别模块、管线识别模块、关系识别模块所得到的一个或多个识别结果得到重建后的待校核图纸。

8、所述图纸重建模块在进行重建时能够根据图神经网络预测的上下游关系对识别的管线和符号进行连接，并将未识别的管线和符号进行保留，以使得该未识别的管线和符号能够被直接发送至校核模块。

9、优选地，经过训练后，符号识别的精度可达到90%以上，能精确分割较长的管线，以及准确预测符号和管线之间的上下游关系。如此设置可实现端到端的检测和分割网络，以自动分割和检测符号，从而不需要人工进行中间过程的干预。

10、根据一种优选实施方式，文字识别模块能够执行如下步骤：

11、使用ppocr网络对通用文字识别数据集进行文字检测和文字识别的训练；

12、将图片或者pdf里的文字放入训练好的模型进行识别，识别结果包括文字的位置和文字的内容；

13、根据设备编号和管线编号的说明，编写正则表达式；

14、通过正则表达式的筛选，将不符合设计格式的设备编号和管线编号过滤掉；

15、将符合要求的设备编号和管线编号存入数据库，以便下游任务使用。

16、根据一种优选实施方式，符号识别模块能够执行如下步骤：

17、进行训练数据集标注；

18、使用yolo网络进行目标检测的训练，训练中识别的内容包括符号的位置和符号的名称；

19、将新的图纸放入训练好的yolo网络中，并对符号进行识别；

20、将识别出的符号存入数据库，以便下游任务使用。

21、根据一种优选实施方式，管线识别模块能够执行如下步骤：

22、进行训练数据集标注；

23、使用transformer模型进行实例分割训练，输出结果包括管线的起点和终点像素值以及两点之间的像素值；

24、将新的图片放入训练好的模型，进行管线的实例分割；

25、将识别的管线的终点和起点像素值存入数据库，以便下游任务使用。

26、相比于本领域在对管线进行提取时所常用的霍夫直线检测等传统的机器学习方法，本专利技术提出了基于深度学习的管线分割方案，大大提高了检测的准确率和提升了检测速度。如此设置是因为传统的霍夫直线检测需要手动调整大量的超参数，并且适应性差，对新的图片往往需要重新调整超参数。而本专利技术所选用的机器学习方法适应性好，无需手动调参，对新图片无需重新训练，而且结果不受图片中的噪音干扰，提高了检测的准确率。进一步地，本专利技术可进行批次处理，一次可以输入数张图片同时计算处理，相比于传统方法大大提高了检测速度。

27、对于p&id图纸数字化过程中产生的错误，现有技术尝试通过构建数据集的方式对类似数字化模型构建过程中产本文档来自技高网...

【技术保护点】

1.一种基于端到端的深度学习的P&ID图纸识别与重建系统，其特征在于，其包括：

2.根据权利要求1所述的系统，其特征在于，所述文字识别模块能够执行如下步骤：

3.根据权利要求1所述的系统，其特征在于，所述符号识别模块能够执行如下步骤：

4.根据权利要求1所述的系统，其特征在于，所述管线识别模块能够执行如下步骤：

5.根据权利要求1所述的系统，其特征在于，所述关系识别模块能够执行如下步骤：

6.根据权利要求1所述的系统，其特征在于，所述图纸重建模块得到的待校核图纸能够被一个或多个处于启用状态的分析模块调取，其中，任一分析模块能够响应于从错误预设模块获得的对应类型的“错误”而被启用，以执行错误分析。

7.根据权利要求6所述的系统，其特征在于，所述错误预设模块能够生成与当前的待校核图纸相关联的检查清单，以使得在待校核图纸中的一处或多处“错误”能够被标记，其中，所述错误预设模块所生成的检查清单能够根据“错误”的产生过程和/或情形而将其分类。

8.根据权利要求6所述的系统，其特征在于，可能在符号和/

9.根据权利要求6所述的系统，其特征在于，可能在上下游拓扑关系识别过程产生的错误能够被所述错误预设模块设定为二类错误，以使得响应于从所述错误预设模块获得的与上下游拓扑关系识别过程相关的二类错误对应的二类分析模块被启用，其中，所述二类分析模块包括线型类分析模块、方向类分析模块、关联类分析模块中的一个或多个。

10.根据权利要求8或9所述的系统，其特征在于，各分析模块在执行错误分析后所得到的与分析结果相关的列表能够被所述校核模块收集并生成最终的校核清单，以发送至与所述校核模块通讯连接的用户端。

...

【技术特征摘要】

1.一种基于端到端的深度学习的p&id图纸识别与重建系统，其特征在于，其包括：

2.根据权利要求1所述的系统，其特征在于，所述文字识别模块能够执行如下步骤：

3.根据权利要求1所述的系统，其特征在于，所述符号识别模块能够执行如下步骤：

4.根据权利要求1所述的系统，其特征在于，所述管线识别模块能够执行如下步骤：

5.根据权利要求1所述的系统，其特征在于，所述关系识别模块能够执行如下步骤：

7.根据权利要求6所述的系统，其特征在于，所述错误预设模块能够生成与当前的待校核图纸相关联的检查清单，以使得在待校核图纸中的一处或多处“错误”能够被标记，其中，所述错误预设模块所生成的检查清单能够根...

【专利技术属性】
技术研发人员：于冬冬，李义琛，陈劲松，李艳松，
申请(专利权)人：北京达美盛软件股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人