使用机器学习对字符串进行分类制造技术

技术编号:24019904 阅读:226 留言:0更新日期:2020-05-02 04:54
通过利用基于机器的学习技术对文档中的字符模式进行分类的系统和方法,包括:生成字符分类训练数据;基于字符分类训练数据构建字符分类模型;获得包括字符模式的图像,所述字符包括一个或多个轮廓;将字符分类模型应用于图像以对轮廓进行分类;以及将标签应用于轮廓的聚类。

Using machine learning to classify strings

【技术实现步骤摘要】
【国外来华专利技术】使用机器学习对字符串进行分类相关申请的交叉引用本申请与2017年9月14日提交的美国临时申请No.62/558,383和2018年4月5日提交的美国临时申请No.62/653,193相关并要求其权益,这些申请的全部内容在此通过引用整体并入本文。
本公开一般而言涉及模式识别,并且更特别地涉及使用机器学习技术的基于字符的文档标记的识别和分类。
技术介绍
管路和设备原理图设计(“P&ID”)是说明工程处理流以及用于实现这些处理流的仪器的工程图。P&ID可以包括用于捕获与P&ID图相关的各种类型的设计信息(诸如安装信息、材料、序列信息、危害信息或其它信息)的标记或标签。在许多情况下,提取、识别和分类与P&ID相关联的标记和标签使得P&ID及其提供的信息可以在数据库系统中访问和搜索是有用的。当前的P&ID标记方法依赖于人工识别P&ID标记并生成标记索引列表。例如,人类操作员可以目视检查P&ID,以提取包括符号、标记及其组织的信息组成部分,并在数据库中将这些组成部分编目。在一些示例中,光学字符识别(OCR)技术也可以用于帮助这一处理。但是,这些解决方案最终效率低下并且不准确。这些解决方案既不成本有效也不稳健。
技术实现思路
机器学习模型可以应用于P&ID图,以提取图形组成部分,诸如符号和代表化学组分或物理组分的传输的处理循环,或者控制处理,以便克服现有基于OCR的和手动分类的解决方案的缺点。本公开的一些实施例实现了多层框架,以识别表示装备的符号、表示装备之间的连接的示意图线(例如,连接器线),以及编码上下文信息和/或各种设计规范的标记。该模型可以是机器学习算法,诸如卷积神经网络、决策树或如本领域已知的其它机器学习算法。训练数据可以是合成的,或者可以是从实际的先前标记的P&ID图收集的。本公开的一个方面涉及一种系统,该系统被配置用于识别标准化系统图中的符号。该系统可以包括由机器可读指令配置的一个或多个逻辑电路。(一个或多个)处理器可以被配置为获得包括多个训练图像的符号识别训练数据集。(一个或多个)处理器可以被配置为基于符号识别训练数据集来生成符号识别模型。(一个或多个)处理器可以被配置为获得包括符号的模式的图像。这些符号可以包括用于表示机械或电气组成部分的复杂的几何形状。(一个或多个)处理器可以被配置为将符号识别模型应用于几何形状以识别符号。(一个或多个)处理器可以被配置为将识别出的符号存储在关系数据库中。本公开的另一方面涉及一种用于识别标准化系统图中的符号的模式的方法。该方法可以包括获得包括多个训练图像的符号分类训练数据集。该方法可以包括基于符号分类训练数据集来生成符号分类模型。该方法可以包括获得包括符号的模式的图像。这些符号可以包括一个或多个轮廓。该方法可以包括基于轮廓的位置信息将符号聚类为分层组。该方法可以包括将符号分类模型应用于轮廓以识别符号和分层组。该方法可以包括将识别出的符号与对应的分层组一起存储在关系数据库中。本公开的实施例提供了用于通过利用基于机器学习的技术来对图像中诸如字母数字字符之类的形状或对象的模式进行分类的系统和方法。在一些实施例中,该方法可以包括生成字符分类训练数据并基于字符分类训练数据构建字符分类模型。该方法可以包括:找到图像中的所有轮廓;对轮廓进行聚类;将字符分类模型应用于图像,以将轮廓分类为目标字符或非字符;以及提取聚类的字符组作为感兴趣的标记或标签。本文公开的实施例可以包括一种用于将形状的模式分类为字符并将字符分组为标记的系统。例如,该系统可以包括数据存储库和字符分类逻辑电路。字符分类逻辑电路可以包括处理器和其上嵌入有计算机可执行指令的非暂态计算机可读介质,并且计算机可执行指令可以被配置为使处理器生成字符分类训练数据、基于字符分类训练数据构建字符分类模型,以及将字符分类模型应用于图像以对目标字符进行分类。在一些实施例中,该系统可以通过相对于整个图像定位图像轮廓、基于字符分类模型将轮廓标注为字符或非字符,以及基于字符的位置信息将字符聚类到分层组中来识别标记。该系统可以基于字符组内的字符的模式从字符组中提取标记或标签。在所公开技术的一些实施例中,标记提取处理可以包括识别图像内的一个或多个文本区域,该文本区域包括字符的分组。可以使用文本区域识别模型来识别文本区域。在一些实施例中,文本区域识别模型可以包括机器学习算法。标记提取处理可以包括用经训练的字符分类模型来扫描识别出的文本区域以对各个字符进行分类,然后提取和/或存储识别出的字符。在参考附图考虑以下描述和所附权利要求书后,本文公开的系统和/或方法的这些和其它目的、特征和特性以及结构的相关元件的操作方法和功能以及零件的组合和制造的经济性将变得更加明显,所有附图均构成本说明书的一部分,其中相似的附图标记在各个图中表示对应的部分。但是,应当明确地理解,附图仅出于说明和描述的目的,并且不旨在作为对本专利技术的限制的定义。如说明书和权利要求书中所使用的,单数形式的“一”、“一个”和“该”包括复数指示物,除非上下文另外明确指出。附图说明参考以下附图详细描述根据一个或多个各种实施例的本文公开的技术。提供附图仅出于说明的目的,并且仅描绘了所公开技术的典型或示例实施例。提供这些附图是为了促进读者理解所公开的技术,并且不应被认为是对其广度、范围或适用性的限制。应当注意的是,为了清楚和易于图示,这些附图不一定按比例绘制。图1图示了与本文公开的实施例一致的使用机器学习模型对基于字符的文档标记进行识别和分类的示例计算机实现的方法。图2A图示了与本文公开的实施例一致的用于针对字符分类模型的合成训练数据生成的示例处理。图2B图示了如由本文公开的实施例所使用的感兴趣的示例字符和字体。图2C图示了如由本文公开的实施例所使用的示例原型字符。图2D图示了与本文公开的实施例一致的从原型创建的示例训练图像。图3A图示了与本文公开的实施例一致的用于标记提取的示例处理。图3B图示了如本文公开的实施例中使用的部分P&ID输入图像的示例。图3C图示了如根据本文公开的实施例被处理以识别空白分割的轮廓的图3B的示例输入图像。图3D图示了如根据本文公开的实施例被处理以对轮廓进行分类的图3B的示例输入图像。图3E图示了如由本文公开的实施例所使用的在每个空白分割的轮廓处提取并分类为感兴趣的字符的子图像块的示例。图3F图示了如根据本文公开的实施例处理的图3B的示例输入图像。图3G图示了如根据本文公开的实施例被处理以对分类字符进行分组的图3B的示例输入图像。图3H图示了根据本文公开的实施例的从图3B的示例输入图像中提取的标记。图4A图示了与本文公开的实施例一致的用于生成用于文本区域识别的训练数据的示例方法。图4B图示了根据本文公开的实施例的以编程方式创建的训练图像的示例。图5图示了与本文公开的实施例一致的用于使用文本区域识别本文档来自技高网...

【技术保护点】
1.一种用于对P&ID图像中的字符模式进行分类的机器学习模型实现的方法,所述方法包括:/n利用训练数据生成逻辑电路生成合成字符训练图像集合;/n利用符号生成逻辑电路,基于作为训练数据的所述合成字符训练图像集合来训练字符分类模型;/n从P&ID可搜索数据库中获得包括字符模式的P&ID图像,所述字符包括一个或多个轮廓;/n将字符分类模型应用于P&ID图像中的轮廓;/n基于轮廓的位置信息将轮廓聚类为分层的组;/n构造与轮廓的聚类对应的标记标签;以及/n在数据存储库中存储标记标签。/n

【技术特征摘要】
【国外来华专利技术】20170914 US 62/558,383;20180405 US 62/653,1931.一种用于对P&ID图像中的字符模式进行分类的机器学习模型实现的方法,所述方法包括:
利用训练数据生成逻辑电路生成合成字符训练图像集合;
利用符号生成逻辑电路,基于作为训练数据的所述合成字符训练图像集合来训练字符分类模型;
从P&ID可搜索数据库中获得包括字符模式的P&ID图像,所述字符包括一个或多个轮廓;
将字符分类模型应用于P&ID图像中的轮廓;
基于轮廓的位置信息将轮廓聚类为分层的组;
构造与轮廓的聚类对应的标记标签;以及
在数据存储库中存储标记标签。


2.如权利要求1所述的方法,其中生成训练数据包括:
创建感兴趣的原型字符;
将感兴趣的原型字符作为模板存储在数据存储库中,以便以编程方式创建变化的训练图像;以及
使用原型字符创建多个随机的变化的训练数据。


3.如权利要求1所述的方法,其中字符分类模型包括机器学习算法。


4.如权利要求3所述的方法,其中机器学习算法包括卷积神经网络、支持向量机、梯度提升决策树或逻辑回归模型。


5.如权利要求2所述的方法,其中生成训练数据还包括修改感兴趣的原型字符的大小、平移、旋转或其它可能的变化。


6.如权利要求2所述的方法,其中生成训练数据还包括将噪声模式应用于一个或多个图像。


7.如权利要求6所述的方法,其中应用噪声模式包括:
选择非字符背景;
生成随机噪声模式以创建噪声背景;以及
在噪声背景上放置变化的原型字符序列。


8.如权利要求2所述的方法,其中生成训练数据还包括以组合方式随机选择原型字符包括在序列中,以支持N元文法类型的训练数据。


9.如权利要求1所述的方法,其中构建字符分类模型包括将深度学习处理应用于训练数据。


10.如权利要求1所述的方法,其中将字符分类模型应用于图像以识别字符包括:对图像进行分割以及对图像应用启发法,以抑制非字符轮廓并通过用字符分类模型对轮廓进行分类来识别字符轮廓。


11.一种用于对字符模式进行分类的系统,所述系统包括:
数据存储库和字符分类逻辑电路,所述字符分类逻辑电路包括处理器和其上嵌入有计算机可执行指令的非暂态计算机可读介质,...

【专利技术属性】
技术研发人员:P·杜克程抒星
申请(专利权)人:雪佛龙美国公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1