一种文本图像中表格的结构化信息的识别方法及装置制造方法及图纸

技术编号：24458421 阅读：43 留言：0更新日期：2020-06-10 16:15

本发明专利技术实施例提供一种文本图像中表格的结构化信息的识别方法及装置，所述方法包括：在所述文本图像中确定属于同一个表格内的表格线，确定与所述表格线的方向相垂直的第一目标坐标轴；确定所述同一个表格内的初始单元格；确定相邻两个初始单元格的交线，构建包含所述交线的多边形，确定所述多边形的包围区域内的线段像素数，并根据所述线段像素数和预设阈值的比较结果，确定是否合并相邻两个初始单元格；遍历所有相邻两个初始单元格，并根据合并结果确定结构化信息的识别结果。所述装置执行上述方法。本发明专利技术实施例提供的方法及装置，能够自动和准确地识别文本图像中表格的结构化信息。

A recognition method and device for structured information of table in text image

全部详细技术资料下载

【技术实现步骤摘要】
一种文本图像中表格的结构化信息的识别方法及装置
本专利技术涉及图像处理
，尤其涉及一种文本图像中表格的结构化信息的识别方法及装置。
技术介绍
随着人工智能技术的发展，在工业领域得到了越来越广泛的应用。人工智能技术在深入到工业系统中后，在一些机械性、重复性的劳动过程中，可以部分替代人工，或者说辅助人工，以提高人的生产效率，降低企业的生产成本。这一技术框架被称之为机器人流程自动化(RoboticProcessAutomation，简称“RPA”)。RPA的一个典型应用是企业的合同文本的自动化处理流程。一个企业在生产过程中，有大量的合同需要处理，如各类原料采购合同和设备销售合同等。由于合同涉及到多类供方或需方，且合同内容因具体业务而不同，合同内容并不标准。企业往往需要雇佣多位财务人员，每天对各类合同进行人工审核和标准化处理，人工审核成本高，且容易出错。本专利技术实施例的背景是利用人工智能技术，将企业的大量纸质合同进行统一扫描或拍照，将这些合同进行电子化，得到包含表格的文本图像，然后，进行光学字符识别(OpticalCharact本文档来自技高网...

【技术保护点】
1.一种文本图像中表格的结构化信息的识别方法，其特征在于，包括：/n在所述文本图像中确定属于同一个表格内的表格线，确定与所述表格线的方向相垂直的第一目标坐标轴；/n获取所述同一个表格内的文字度量信息、所述表格线在所述第一目标坐标轴上的坐标，并根据与所述文字度量信息相对应的、相同方向的相邻两条表格线对应的相邻坐标和所述文字度量信息，确定所述同一个表格内的初始单元格；/n确定相邻两个初始单元格的交线，构建包含所述交线的多边形，确定所述多边形的包围区域内的线段像素数，并根据所述线段像素数和预设阈值的比较结果，确定是否合并相邻两个初始单元格；/n遍历所有相邻两个初始单元格，并根据合并结果确定所述同一个...

【技术特征摘要】
1.一种文本图像中表格的结构化信息的识别方法，其特征在于，包括：
在所述文本图像中确定属于同一个表格内的表格线，确定与所述表格线的方向相垂直的第一目标坐标轴；
获取所述同一个表格内的文字度量信息、所述表格线在所述第一目标坐标轴上的坐标，并根据与所述文字度量信息相对应的、相同方向的相邻两条表格线对应的相邻坐标和所述文字度量信息，确定所述同一个表格内的初始单元格；
确定相邻两个初始单元格的交线，构建包含所述交线的多边形，确定所述多边形的包围区域内的线段像素数，并根据所述线段像素数和预设阈值的比较结果，确定是否合并相邻两个初始单元格；
遍历所有相邻两个初始单元格，并根据合并结果确定所述同一个表格内的最终单元格，并将所有最终单元格作为结构化信息的识别结果。

2.根据权利要求1所述的文本图像中表格的结构化信息的识别方法，其特征在于，所述文字度量信息包括文字宽度信息和文字高度信息；相应的，所述根据与所述文字度量信息相对应的、相同方向的相邻两条表格线对应的相邻坐标和所述文字度量信息，确定所述同一个表格内的初始单元格，包括：
若所述文字度量信息为所述文字宽度信息，则计算竖直方向的相邻两条表格线对应的相邻横坐标之间的横坐标差值，并根据所述横坐标差值与所述文字宽度信息，确定所述同一个表格内的列数；
若所述文字度量信息为所述文字高度信息，则计算水平方向的相邻两条表格线对应的相邻竖坐标之间的竖坐标差值，并根据所述竖坐标差值与所述文字高度信息，确定所述同一个表格内的行数；
根据所述列数和所述行数，确定所述同一个表格内的初始单元格。

3.根据权利要求2所述的文本图像中表格的结构化信息的识别方法，其特征在于，所述根据所述横坐标差值与所述文字宽度信息，确定所述同一个表格内的列数，包括：
若所述横坐标差值小于所述文字宽度信息与预设文字宽度系数的乘积，则将与所述横坐标差值相对应的竖直方向的相邻两条表格线进行合并；
若所述横坐标差值大于等于所述文字宽度信息与预设文字宽度系数的乘积，则不将与所述横坐标差值相对应的竖直方向的相邻两条表格线进行合并；
根据对竖直方向的相邻两条表格线的合并结果，确定所述同一个表格内的列数；其中，所述预设文字宽度系数的取值范围为0.4～0.6；
所述根据所述竖坐标差值与所述文字高度信息，确定所述同一个表格内的行数，包括：
若所述竖坐标差值小于所述文字高度信息与预设文字高度系数的乘积，则将与所述竖坐标差值相对应的水平方向的相邻两条表格线进行合并；
若所述竖坐标差值大于等于所述文字高度信息与预设文字高度系数的乘积，则不将与所述竖坐标差值相对应的水平方向的相邻两条表格线进行合并；
根据对水平方向的相邻两条表格线的合并结果，确定所述同一个表格内的行数；其中，所述预设文字高度系数的取值范围为0.4～0.6。

4.根据权利要求1所述的文本图像中表格的结构化信息的识别方法，其特征在于，所述根据所述线段像素数和预设阈值的比较结果，确定是否合并相邻两个初始单元格，包括：
若所述线段像素数大于等于所述预设阈值，则确定不合并相邻两个初始单元格；
若所述线段像素数小于所述预设阈值，则确定合并相邻两个初始单元格。

5.根据权利要求1所述的文本图像中表格的结构化信息的识别方法，其特征在于，所...

【专利技术属性】
技术研发人员：刘宁，吴志超，王静，胡茜，董婉，申亚男，
申请(专利权)人：北京爱医生智慧医疗科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人