用于从流程图图像中自动提取信息的系统、方法和计算机程序产品技术方案

技术编号：34596721 阅读：33 留言：0更新日期：2022-08-20 08:57

一种从流程图图像中提取信息的方法，该流程图图像包括：其中封围有文本的多个封闭形状的数据节点、连接多个封闭形状的数据节点的连接线以及与连接线相邻的自由文本，该方法包括：接收流程图图像、检测封闭形状的数据节点、对被封围在封闭形状的数据节点内的文本进行定位、以及对经定位文本施加掩模，以生成带注释的图像。检测带注释的图像中的线，以将其重建为封闭形状的数据节点和连接线。提取具有多个封闭形状的数据节点和连接线的树框架。接着，对自由文本进行定位。使用基于定向的二维聚类，将近侧定向和定位在一起的自由文本的分块组装成文本块。块组装成文本块。块组装成文本块。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于从流程图图像中自动提取信息的系统、方法和计算机程序产品

[0001]本说明书大体涉及用于使用计算机视觉技术从图像中检索信息的系统、方法和计算机程序产品，更具体地，涉及用于使用计算机视觉技术从流程图图像中自动提取信息的系统、方法和计算机程序产品。

技术介绍

[0002]流程图通常用于各种领域，并且以简明和结构化的形式表示人类编策的知识。医学和科学领域充满关于症状、观察和诊断的流程图，这些流程图可用于临床决策支持、内容搜索系统、自动问题生成等。流程图的图像可具有不同的形状、大小、流程类型、格式、颜色、内容密度、质量、字体、图像分辨率等。因此，期望有从流程图中完整并准确地提取信息的方法，以便将信息编译成可搜索和交互式的格式，以便随后在准备例如机器可学习资产和交互式知识库中受益。

技术实现思路

[0003]本说明书涉及用于从流程图图像中自动提取信息的系统、方法和计算机程序产品，流程图图像包括以下各项中的一项或多项：其中包围有文本的多个封闭形状的数据节点、连接多个封闭形状的数据节点中的一者或多者的连接线、以及与连接...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种从流程图图像中提取信息的方法，所述流程图图像包括以下各项中的一项或多项：其中封围有文本的多个封闭形状的数据节点、连接所述多个封闭形状的数据节点中的一者或多者的连接线、以及与所述连接线相邻的自由文本，所述方法包括以下步骤：接收作为电子图像文件的所述流程图图像；检测所述多个封闭形状的数据节点；对被封围在所述多个封闭形状的数据节点内的所述文本进行定位；对所述多个封闭形状的数据节点内的经定位文本施加掩模，以生成带注释的图像；生成所述自由文本中字符尺寸的统计大小分布，以识别所述连接线；检测所述带注释的图像中的线，以将所述线重建为封闭形状的数据节点和连接线；提取具有所述多个封闭形状的数据节点和所检测到的连接线的树框架；对与所述连接线相邻的所述自由文本进行定位；以及使用基于定向的二维聚类，将近侧定向和定位在一起的所述自由文本的分块组装成文本块。2.如权利要求1所述的方法，进一步包括以下步骤：使用字符识别算法识别所述经定位文本和所述文本块中的字符；以及将所述树框架、所述经定位文本和所述文本块编译成具有可搜索和交互式电子文件格式的流程图文件，所述电子文件格式被配置成使所述流程图文件能够具有比所述电子图像文件更小的大小。3.如权利要求1所述的方法，其特征在于，检测所述带注释的图像中的线，以将所述线重建为封闭形状的数据节点和连接线的所述步骤包括以下步骤：在水平和垂直方向上识别所述带注释的图像上的对象的图像梯度；使用边缘检测算法和形状检测算法，基于所识别的图像梯度，作为在水平和垂直方向上近似的所述线的代理来检测所述带注释的图像上的所述线；使用被定制为从所述带注释的图像中移除非几何对象和文本字符的启发式确定的核，作为在水平和垂直方向上近似的形态梯度来检测所述带注释的图像上的所述线；对基于所识别的图像梯度检测到的所述线和作为形态梯度检测到的所述线进行组合；以及将所述线重建为封闭形状的数据节点和连接线。4.如权利要求1所述的方法，其特征在于，提取具有所述多个封闭形状的数据节点和所检测到的连接线的树框架的所述步骤包括以下步骤：确定所检测到的连接线中的每一者是连接符还是带有箭头的流线；以及基于所述连接线之间的接近度、二维空间中任意两条连接线之间的重叠、以及所述连接线的几何斜率来组装所述连接线。5.如权利要求1所述的方法，其特征在于，对与所述连接线相邻的所述自由文本进行定位的所述步骤包括以下步骤：通过执行一个或多个形态变换，将所述自由文本的字符合并成自由文本斑点；通过确定沿着所述自由文本斑点的边缘的连续点是否具有相同的像素密度和颜色来检测所述自由文本斑点的轮廓；基于具有大多数字母数字字符，使用字符识别算法来过滤所述自由文本斑点的所述轮
廓；以及识别近侧定向和定位在一起的所述自由文本的分块。6.如权利要求1所述的方法，其特征在于，检测所述多个封闭形状的数据节点的所述步骤包括以下步骤：使用边缘检测算法和一个或多个形态变换将所述流程图图像预处理为一个或多个归一化图像，以突出显示所述多个封闭形状的数据节点中的每一者的几何边缘；通过使用相连组件方法分割所述流程图图像来从所述多个封闭形状的数据节点中检测几何形状和非几何形状；通过使用轮廓检测方法来从所述多个封闭形状的数据节点中检测几何形状和非几何形状；使用统计滤波器和字符识别算法来过滤掉与封闭形状的数据节点不对应的所述几何形状和非几何形状的轮廓；使用曲线拟合算法、特征提取算法和特征描述符来过滤所述几何形状的轮廓，以近似包括文本的几何形状；以及使用形状模板和形状匹配算法来验证所述包括文本的几何形状。7.如权利要求1所述的方法，其特征在于，对被封围在所述多个封闭形状的数据节点内的所述文本进行定位的所述步骤包括以下步骤：对来自所述流程图图像的不同预处理变体的包括文本的几何形状的近似结果进行组合；使用非最大压缩算法压缩所述近似结果，以定义文本和形状边界；以及将所述文本与所述包括文本的几何形状分离，以确定所述多个封闭形状的数据节点。8.一种用于从流程图图像中提取信息的系统，所述流程图图像包括以下各项中的一项或多项：其中封围有文本的多个封闭形状的数据节点、连接所述多个封闭形状的数据节点中的一者或多者的连接线、以及与所述连接线相邻的自由文本，所述系统包括：处理器；以及耦合至所述处理器的非瞬态处理器可读存储器，所述非瞬态处理器可读存储器包括存储在其中的机器可读指令集，当由所述处理器执行时，所述机器可读指令集使所述处理器执行以下步骤：接收作为电子图像文件的所述流程图图像；检测所述多个封闭形状的数据节点；对被封围在所述多个封闭形状的数据节点内的所述文本进行定位；对所述多个封闭形状的数据节点内的经定位文本施加掩模，以生成带注释的图像；生成所述自由文本中字符尺寸的统计大小分布，以识别所述连接线；检测所述带注释的图像中的线，以将所述线重建为封闭形状的数据节点和连接线；提取具有所述多个封闭形状的数据节点和所检测到的连接线的树框架；对与所述连接线相邻的所述自由文本进行定位；以及使用基于定向的二维聚类，将近侧定向和定位在一起的所述自由文本的分块组装成文本块。9.如权利要求8所述的系统，其特征在于，所述机器可读指令集进一步使所述处理器执
行以下步骤：使用字符识别算法识别所述经定位文本和所述文本块中的字符；以及将所述树框架、所述经定位文本和所述文本块编译成具有可搜索和交互式电子文件格式的流程图文件，所述电子文件格式被配置成使所述流程图文件能够具有比所述电子图像文件更小的大小。10.如权利要求8所述的系统，其特征在于，用于检测所述带注释的图像中的线，以将所述线重建为封闭形状的数据节点和连接线的所述机器可读指令集进一步使所述处理器执行以下步骤：在水平和垂直方向上识别所述带注释的图像上的对象的图像梯度；使用边缘检测算法和形状检测算法，基于所识别的图像梯度，作为在水平和垂直方向上近似的所述线的代理来检测所述带注释的图像上的所述线；使用被定制为从所述带注释的图像中移除非几何对象和文本字符的启发式确定的核，作为在水平和垂直方向上近似的形态梯度来检测所述带注释的图像上的所述线；对基于所识别的图像梯度检测到的所述线和作为形态梯度检测到的所述线进行组合；以及将所述线重建为封闭形状的数据节点和连接线。11.如权利要求8所述的方法，其特征在于，用于提取具有所述多个封闭形状的数据节点和所检测到的连接线的树框...

【专利技术属性】
技术研发人员：A，
申请(专利权)人：爱思唯尔股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人