用于从管道和仪表图中自动化提取信息的系统和方法技术方案

技术编号:24456463 阅读:36 留言:0更新日期:2020-06-10 15:41
本文提供了用于从管道和仪表图中自动化提取信息的系统和方法。传统的系统和方法不提供从管道和仪表图的端到端和自动数据提取。所公开的方法通过经由一个或多个硬件处理器,通过实施一种或多种图像处理和深度学习技术来从一个或多个管道和仪表图检测多个组成部分,从管道和仪表图自动生成端到端信息;经由关联模块,通过实施欧几里德距离技术,将检测到的多个组成部分中的每个相关联;通过实施结构化技术,基于所述相关联的多个组成部分中的每个,生成多个树形数据结构,其中所述多个树形数据结构中的每个捕获与所述一个或多个管道和仪表图相对应的管线示意图的处理流程。

Systems and methods for automated extraction of information from P & IDs

【技术实现步骤摘要】
用于从管道和仪表图中自动化提取信息的系统和方法相关申请和优先权的交叉引用本专利申请要求2018年11月30日提交的印度专利申请201821045399的优先权。
本文的公开内容一般性地涉及工程示意图,并且更具体地,涉及用于从管道和仪表图中自动化信息提取的系统和方法。
技术介绍
管道和仪表图包括表示工程示意图的最常见模式之一。这些图描述了工程处理流程的布局以及互连的处理设备。多年来,管道和仪表图纸一直手动生成、扫描并存储为图像文件。这些文件需要进行数字化以便进行库存管理和更新,并且可以轻松参考原理图的不同组成部分。存在与数字化现实世界的管道和仪表图相关联的几个具有挑战性的视觉问题。例如,现实世界的管道和仪表图有几种不同的分辨率,通常包含嘈杂的文本信息。从这些图中提取仪表信息涉及准确检测通常在这些图之间具有微小视觉差异的符号。识别可能在图像中的不同点处会聚和发散的管线是引起关注的另一个原因。管道和仪表图能够表示复杂的工程工作流程,描绘了通过管线、容器、致动器和控制阀的过程流程的示意图。通用表示包括流体输入点、诸如管线的路径、表示控制和测量仪表的符号以及汇点。大多数行业以硬拷贝或扫描图像的形式维护这些复杂的管道和仪表图纸,并且没有任何自动机制来提取信息和分析管道和仪表。因此,对过程改进的日后分析和审计涉及手动参与,鉴于所需的领域专业知识,这种参与很昂贵。因此,实现手动技术的传统系统和方法无法数字化且不能从管道和仪表图中提取端到端信息。
技术实现思路
本公开的实施例呈现技术改进作为本专利技术人在传统系统中认识到的一个或多个上述技术问题的解决方案。例如,在一个实施例中,一种用于从管道和仪表图中自动化提取信息的方法,所述方法包括:经由一个或多个硬件处理器,通过实现一种或多种图像处理和深度学习技术,从一个或多个管道和仪表图检测多个组成部分,其中多个组成部分包括管道、管线代码、入口和出口、符号和文本中的至少一个;经由关联模块,通过实施欧几里德距离技术,将检测到的多个组成部分中的每个相关联,其中所述关联包括将检测到的多个组成部分中的每个与适当的管线中的至少一个映射;通过实施结构化技术,基于相关联的多个组成部分中的每个,生成多个树形数据结构,其中所述多个树形数据结构中的每个捕获与所述一个或多个管道和仪表图相对应的管线示意图的处理流程;通过实施连接文本提议网络(CTPN)技术,从一个或多个管道和仪表图中过滤包括多个假阳性管线代码的一个或多个管线代码;通过实施完全卷积神经网络(FCN)技术,从符号中提取上下文信息的集合,并且学习符号中一个或多个对象的空间位置;通过过滤技术修剪多个树形数据结构中的每个,用于从一个或多个管道和仪表图中过滤假阳性管线的集合;通过过滤技术从一个或多个管道和仪表图中去除一个或多个管道,并且其中一个或多个管道在多个树形数据结构的每个中表示为叶节点;并且从根节点开始遍历多个树形数据结构中的每个,并移除不通向任何入口的所有节点。在另一方面,提供了一种用于从管道和仪表图中自动化提取信息的系统,所述系统包括存储指令的存储器;一个或多个通信接口;以及经由所述一个或多个通信接口耦合到所述存储器的一个或多个硬件处理器,其中所述一个或多个硬件处理器由所述指令配置为:通过实施一种或多种图像处理和深度学习技术来从一个或多个管道和仪表图检测多个组成部分,其中多个组成部分包括管道、管线代码、入口和出口、符号和文本中的至少一个;经由关联模块,通过实施欧几里德距离技术,将检测到的多个组成部分中的每个相关联,其中所述关联包括将检测到的多个组成部分中的每个与适当的管线中的至少一个映射;通过实施结构化技术,基于相关联的多个组成部分中的每个,生成多个树形数据结构,其中所述多个树形数据结构中的每个捕获与所述一个或多个管道和仪表图相对应的管线示意图的处理流程;通过实施连接文本提议网络(CTPN)技术,通过从一个或多个管道和仪表图中过滤包括多个假阳性管线代码的一个或多个管线代码来检测管线代码;通过实施完全卷积神经网络(FCN)技术从符号中提取上下文信息的集合并学习符号中的一个或多个对象的空间位置;捕获管道示意图的过程流程是通过过滤技术修剪多个树形数据结构中的每个,用于从一个或多个管道和仪表图中过滤一组假阳性管道;通过实施过滤技术,从一个或多个管道和仪表图中去除一个或多个管道,其中一个或多个管道在多个树形数据结构的每个中表示为叶节点;并且从根节点开始遍历多个树形数据结构中的每个,并移除不通向任何入口的所有节点。在又一方面,提供了一种或多种非暂时性机器可读信息存储介质,其包括一个或多个指令,当由一个或多个硬件处理器执行时,使得一个或多个硬件处理器执行一种用于从管道和仪表图中自动化提取信息的方法,所述方法包括:通过实施一种或多种图像处理和深度学习技术从一个或多个管道和仪表图中检测多个组成部分,其中多个组成部分包括管道、管线代码、入口和出口、符号和文本中的至少一个;经由关联模块,通过实施欧几里德距离技术,将检测到的多个组成部分中的每个相关联,其中所述关联包括将所检测的多个组成部分中的每个与适当的管线中的至少一个映射;通过实施结构化技术,基于相关联的多个组成部分中的每个,生成多个树形数据结构,其中所述多个树形数据结构中的每个捕获与所述一个或多个管道和仪表图相对应的管线示意图的处理流程;通过实施连接文本提议网络(CTPN)技术,从一个或多个管道和仪表图中过滤包括多个假阳性管线代码的一个或多个管线代码;通过实施完全卷积神经网络(FCN)技术,从符号中提取上下文信息的集合,并学习符号中一个或多个对象的空间位置;通过过滤技术修剪多个树形数据结构中的每个,用于从一个或多个管道和仪表图中过滤假阳性管线的集合;通过过滤技术从一个或多个管道和仪表图中去除一个或多个管道,并且其中一个或多个管道在多个树形数据结构的每个中表示为叶节点;并且从根节点开始遍历多个树形数据结构中的每个,并移除不通向任何入口的所有节点。应当理解,前面的一般性描述和下面的详细描述都只是示例性和说明性的,并不是对要求保护的本专利技术的限制。附图说明包含在本公开中并构成本公开的一部分的附图示出了示例性实施例,并且与说明书一起用于说明所公开的原理。图1示出了根据本公开的一些实施例的用于从管道和仪表图中自动化提取信息的系统的框图。图2是描绘根据本公开的一些实施例的用于从管道和仪表图中自动化提取信息的系统的组成部分和流程的架构图。图3是示出了根据本公开的一些实施例的从管道和仪表图中自动化提取信息的过程中涉及的步骤的流程图。图4示出了根据本公开的一些实施例的管道和仪表图纸的示例。图5示出了根据本公开的一些实施例的来自管道和仪表图纸的入口或出口的示例。图6示出了根据本公开的一些实施例的管道和仪表图纸中的管线的示例。图7示出了根据本公开的一些实施例的管道和仪表图纸中的符号的示例。图8示出了根据本公开的一些实施例的通过实施所公开的方法的检测符号的示例。图9示出了根据本公开的一些实施例的通过实施所公开的方法执行的标本文档来自技高网...

【技术保护点】
1.一种用于从管道和仪表图中自动化提取信息的处理器方法,所述方法包括:/n经由一个或多个硬件处理器,通过实施一种或多种图像处理和深度学习技术,从一个或多个管道和仪表图检测多个组成部分,其中所述多个组成部分包括管线、管线代码、入口和出口、符号和文字中的至少一个(301);/n经由关联模块,通过实施欧几里德距离技术,将检测到的多个组成部分中的每个相关联,其中所述关联包括将检测到的多个组成部分中的每个与适当的管线中的至少一个映射(302);以及/n通过实施结构化技术,基于相关联的多个组成部分中的每个,生成多个树形数据结构,其中所述多个树形数据结构中的每个捕获与所述一个或多个管道和仪表图相对应的管线示意图的处理流程(303)。/n

【技术特征摘要】
20181130 IN 2018210453991.一种用于从管道和仪表图中自动化提取信息的处理器方法,所述方法包括:
经由一个或多个硬件处理器,通过实施一种或多种图像处理和深度学习技术,从一个或多个管道和仪表图检测多个组成部分,其中所述多个组成部分包括管线、管线代码、入口和出口、符号和文字中的至少一个(301);
经由关联模块,通过实施欧几里德距离技术,将检测到的多个组成部分中的每个相关联,其中所述关联包括将检测到的多个组成部分中的每个与适当的管线中的至少一个映射(302);以及
通过实施结构化技术,基于相关联的多个组成部分中的每个,生成多个树形数据结构,其中所述多个树形数据结构中的每个捕获与所述一个或多个管道和仪表图相对应的管线示意图的处理流程(303)。


2.根据权利要求1所述的方法,其中在检测管线代码的步骤之前,通过实施连接文本提议网络技术从所述一个或多个管道和仪表图中过滤包括多个假阳性管线代码的一个或多个管线代码。


3.根据权利要求1所述的方法,其中检测所述符号的步骤包括通过实施完全卷积神经网络技术从符号中提取上下文信息的集合并且学习符号中的一个或多个对象的空间位置。


4.根据权利要求3所述的方法,其中提取上下文信息的集合的步骤包括:
(i)经由完全卷积神经网络技术生成用于符号的多个掩模,用于获得多个掩模中的每个掩模的一个或多个轮廓;以及
(ii)根据所生成的一个或多个轮廓表示用于检测符号的符号的形状。


5.根据权利要求1所述的方法,其中经由欧几里德距离技术从所述一个或多个管道和仪表图确定所述适当的管线。


6.根据权利要求1所述的方法,其中所述多个树形数据结构中的每个树包括用于捕获管线示意图的处理流程的中间节点、叶节点和根节点,其中检测到的出口被视为根节点,检测到的入口被视为叶节点,并且检测到的管线对应于中间节点。


7.根据权利要求6所述的方法,其中所述多个树形数据结构中的每个树表示入口和出口之间的一对多关系。


8.根据权利要求1所述的方法,其中在捕获管线示意图的处理流程的步骤之前,经由滤波技术修剪所述多个树形数据结构中的每个,用于从一个或多个管道和仪表图中过滤假阳性管线的集合。


9.根据权利要求8所述的方法,其中过滤假阳性管线的集合的步骤包括经由过滤技术从所述一个或多个管道和仪表图中移除一个或多个管线,并且其中所述一个或多个管线在多个树形数据结构的每个中被表示为叶节点。


10.根据权利要求8所述的方法,其中所述过滤技术包括从根节点开始遍历所述多个树形数据结构中的每个,并且移除不通向任何入口的所有节点。


11.一种用于从管道和仪表图中自动化提取信息的系统(100),所述系统(100)包括:
存储器(102),用于存储指令;
一个或多个通信接口(106);以及
一个或多个硬件处理器(104),经由一个或多个通信接口(106)耦合到存储器(102),其中一个或多个硬件处理器(104)由指令配置为:
通过实施一种或多种图像处理和深度学习技术从一个或多个管道和仪表图中检测多个组成部分,其中所述多个组成部分包括管线、管线代码、入口和出口、符号和文字中的至少一个;
经由关联模块(203),通过实施欧几里德距离技术,将检测到的多个组成部分中的每个...

【专利技术属性】
技术研发人员:M·沙玛R·拉胡尔L·维格S·帕利瓦
申请(专利权)人:塔塔咨询服务公司
类型:发明
国别省市:印度;IN

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1