使用机器学习的管道及仪表流程图信息的分类制造技术

技术编号:26800442 阅读:78 留言:0更新日期:2020-12-22 17:19
公开了用于识别标准化系统图中的符号的图案的系统和方法。公开的实施方式获得或合成地生成包括多个训练图像的符号辨认训练数据集,基于符号辨认训练数据集来生成符号辨认模型,获得包括符号的图案的图像,基于由处理回路识别算法捕获的逻辑关系来将符号分组到处理回路中,将字符分类模型应用到图像轮廓以识别字符,并经由层次聚类将字符分组到位号中,并且将识别的位号、符号和识别的处理回路存储在关系型数据库中。

【技术实现步骤摘要】
【国外来华专利技术】使用机器学习的管道及仪表流程图信息的分类相关申请的交叉引用本申请要求于2018年4月5日提交的美国临时申请第62/653,193号的优先权,其每一个的内容以它们的整体通过引用被并入本文。
本公开通常涉及图案辨认,并且更具体地,涉及使用机器学习技术来识别标准化系统图中符号的图案。
技术介绍
管道及仪表流程图(“P&ID”)是示出工程处理流程连同用于实施那些处理流程的仪表的工程图。P&ID可以包括用来捕获与P&ID图有关的不同类型的设计信息(诸如安装信息、材料、序列信息、危险信息或其他信息)的位号(tag)或标注(label)。在许多情况下,提取、识别和归类与P&ID相关联的位号和标注,使得P&ID及其提供的信息可以在数据库系统内被访问和搜索是有用的。当前P&ID编号的方法依赖于手动工作来识别P&ID位号并生成位号索引列表。例如,人工操作员可以视觉地检阅P&ID,以提取包括符号、位号及其组织的信息成分并将这些成分编目到数据库中。在一些示例中,光学字符识别(OCR本文档来自技高网...

【技术保护点】
1.一种用于识别标准化系统图中的符号的图案的系统,所述系统包括:/n一个或多个逻辑电路,所述一个或多个逻辑电路由机器可读指令配置为:/n获得包括多个训练图像的符号辨认训练数据集,所述多个训练图像包括多个符号;/n基于符号辨认训练数据集来生成符号辨认模型;/n使用处理回路识别逻辑电路来确定所述多个符号的子集内的相邻符号之间的连接关系,并基于连接关系来分配逻辑描述符;/n将所述多个符号的子集连同对应的逻辑描述符一起分组到一个或多个图形结构中;/n使用符号辨认逻辑电路来识别所述多个符号的子集中的辨认的符号,以及/n将辨认的符号连同对应的逻辑描述符一起存储在关系型数据库中。/n

【技术特征摘要】
【国外来华专利技术】20180405 US 62/653,1931.一种用于识别标准化系统图中的符号的图案的系统,所述系统包括:
一个或多个逻辑电路,所述一个或多个逻辑电路由机器可读指令配置为:
获得包括多个训练图像的符号辨认训练数据集,所述多个训练图像包括多个符号;
基于符号辨认训练数据集来生成符号辨认模型;
使用处理回路识别逻辑电路来确定所述多个符号的子集内的相邻符号之间的连接关系,并基于连接关系来分配逻辑描述符;
将所述多个符号的子集连同对应的逻辑描述符一起分组到一个或多个图形结构中;
使用符号辨认逻辑电路来识别所述多个符号的子集中的辨认的符号,以及
将辨认的符号连同对应的逻辑描述符一起存储在关系型数据库中。


2.如权利要求1所述的系统,其中,所述一个或多个逻辑电路由机器可读指令进一步配置为合成地生成训练数据集。


3.如权利要求1所述的系统,其中,所述一个或多个逻辑电路由机器可读指令进一步配置为:
创建感兴趣的原型符号;以及
将感兴趣的原型符号作为用于编程地创建各种训练图像的模板存储在数据存储库中。


4.如权利要求3所述的系统,其中,所述一个或多个逻辑电路由机器可读指令进一步配置为:
生成图像内的符号位置分区的第一阵列;
使用符号辨认模型来确定第一阵列的符号位置分区包括感兴趣的符号的概率;
在第一阵列的符号位置分区包括感兴趣的符号的概率超过选择的阈值的情况下,生成包括所述符号位置分区的第二阵列;
将图案辨认处理应用到第二阵列的符号位置分区,以识别对应的感兴趣的符号;以及
将对应的感兴趣的符号存储在关系型数据库中。


5.如权利要求4所述的系统,其中,所述一个或多个逻辑电路由机器可读指令进一步配置为:
通过评估有关的感兴趣的符号是否存在于任何相邻的符号位置分区中,来确定第一阵列的符号位置分区包括感兴趣的符号的概率。


6.如权利要求5所述的系统,其中,所述一个或多个逻辑电路由机器可读指令进一步配置为以按次序的顺序来评估符号位置分区。


7.如权利要求1所述的系统,其中,图像包括标准化系统图。


8.如权利要求1所述的系统,其中,符号分类训练数据包括标准化系统图的集,所述标准化系统图的集包括对应的符号和层次组的集,并使用图形用户界面来手动识别符号和层次组。


9.如权利要求8所述的系统,其中,获得符号分类训练数据进一步包括修改感兴趣的原型符号的大小、平移、旋转或其他可能的变化。


10.如权利要求8所述的系统,其中,所述一个或多个逻辑电路由机器可读指令进一步配置为通过将噪声图案应用到一个或多个图像来获得训练数据。


11.如权利要求10所述的系统,其中,所述一个或多个逻辑电路由机器可读指令进一步配置为从关系型数据库获得噪声图案。


12.如权利要求10所述的系统,其中,所述一个或多个逻辑电路由机器可读指令进一步配置为使用生成式对抗网络(GAN)来生成噪声图案。


13.如权利要求1所述的系统,其中,符号辨认模型包括机器学习算法。


14.如权利要求13所述的系统,其中,机器学习算法是用于图像辨认任务的基于卷积的神经网络或其变化。


15.如权利要求1所述的系统,其中,所述一个或多个逻辑电路由机器可读指令进一步配置为识别与符号对应的标准化系统图位号,并将识别的标准化系统图位号连同对应的符号一起存储在关系型数据库中。


16.如权利要求15所述的系统,其中,所述一个或多个逻辑电路由机器可读指令进一步配置为:
获得或合成地生成字符分类训练数据;
基于字符分类训练数据来生成字符分类模型;
识别和分类图像内的字符轮廓;
基于字符轮廓的位置信息来将字符聚类到字符层次聚类中;以及
将分组的字符作为位号或标注而存储在关系型数据库中。


17.如权利要求16所述的系统,其中,所述一个或多个逻辑电路由机器可读指令进一步配置为分割图像,并将试探法应用到图像,以抑制非字符轮廓并识别和分类字符轮廓。


18.如权利要求1所述的系统,其中,所述一个或多个逻辑电路由机器可读指令进一步配置为识别图像中与有关的符号的组对应的处理回路。


19.如权利要求18所述的系统,其中,所述一个或多个逻辑电路由机器可读指令进一步配置为:
识别图像内与已知属于处理回路的感兴趣的部件对应的第一感兴趣的符号;
以第一识别的符号作为起点来启动图形遍历处理:
识别从第一感兴趣的符号延伸的连接符线;
识别耦接到第一连接符线的第二感兴趣的符号;
识别从第二感兴趣的符号延伸的第二连接符线;以及
将识别的连接符和对应的感兴趣的符号一起存储在关系型数据库中。


20.如权利要求19所述的系统,其中,所述一个或多个逻辑电路由机器可读指令进一步配置为识别从对应的感兴趣的符号延伸的附加连接符线,直到端接连接符线被识别为耦接回到第一感兴趣的符号为止,使得识别的连接符线与对应的感兴趣的符号形成封闭回路。


21.如权利要求20所述的系统,其中,所述一个或多个逻辑电路由机器可读指令进一步配置为使用边缘检测处理来识别连接符线。


22.如权利要求20所述的系统,其中,所述一个或多个逻辑电路由机器可读指令进一步配置为使用图形用户界面来验证识别的回路。


...

【专利技术属性】
技术研发人员:程抒星P·杜克
申请(专利权)人:雪佛龙美国公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1