一种表单图像的表格行重建方法技术

技术编号:39578622 阅读:12 留言:0更新日期:2023-12-03 19:29
本发明专利技术涉及人工智能技术领域,尤其涉及一种表单图像的表格行重建方法

【技术实现步骤摘要】
一种表单图像的表格行重建方法、装置、设备及介质


[0001]本专利技术涉及人工智能
,尤其涉及一种表单图像的表格行重建方法

装置

设备及介质


技术介绍

[0002]数字医疗是把现代计算机技术

信息技术应用于整个医疗过程的一种新型的现代化医疗方式,是公共医疗的发展方向和管理目标

在数字医疗研究过程中,通常将病历

病理

手术等各种以格式化的形式的数据作为数据源,分别从这些数据源中进行信息抽取,以获取对应信息

由于在就医过程中,病患会将其他医院就诊产生的纸质版的病历

检查单

化验单等带到新的医院进行就诊,这就需要该新的医院对纸质版的信息进行处理,现有技术是基于光学字符识别来对纸质版文件对应的图像进行文档自动化信息抽取,有效地提高人工录入信息的效率,但在信息抽取过程中,如果图像中展示出的信息排列较为整齐,则信息抽取的结果较准确,如果图像中信息排列不整齐,甚至出现变形

错位等情况,则可以认为对应行中的文本内容发生了偏移,不能准确提取对应的文本内容,使文本抽取精度较低

因此,如何提高图像的文本抽取精度成为急需解决的问题


技术实现思路

[0003]有鉴于此,本申请实施例提供了一种表单图像的表格行重建方法

装置

设备及介质,以解决在信息抽取过程中,文本抽取精度较低的问题

[0004]本申请实施例的第一方面提供了一种表单图像的表格行重建方法,所述表格行重建方法,包括:
[0005]获取待重建表单图像,对所述待重建表单图像进行文本识别,得到所述待重建表单图像中的
N
个文本内容,构建包裹对应文本内容的文本框,从
N
个文本内容中筛选出目标文本及对应所述目标文本的文本框,
N
为大于1的整数;
[0006]根据所述目标文本的文本框的坐标信息,确定同一行中多个目标文本的文本框组成的行目标文本框,得到不同行对应的行目标文本框,根据所述不同行对应的行目标文本框,将所述待重建表单图像划分为
M
个子表格,针对任一子表格,根据所述子表格中对应的行目标文本框的坐标信息,计算所述行目标文本框的拟合曲线,
M
为大于1的整数;
[0007]提取与所述目标文本的文本框同列的多个列文本框,针对任一列文本框,根据预设间距,构建所述列文本框对应的有向图,根据所述有向图,确定所述列文本框对应的候选对齐文本框,遍历所有列文本框,得到每个列文本框对应的候选对齐文本框;
[0008]针对任一列,确定对应列文本框与候选对齐文本框组成的候选组合,根据预设筛选条件,对所述候选组合进行筛选,得到筛选后的
K
个最优组合,根据预设搜索算法与所述
K
个最优组合,搜索与对应列文本框为同一行的文本框,得到所述列文本框所在行的行文本框,根据所述行文本框中每个文本框中的文本内容,得到所述待重建表单图像中重建后的行文本,
K
为大于1的整数

[0009]本申请实施例的第二方面提供了一种表单图像的表格行重建装置,所述表格行重建装置包括:
[0010]获取模块,用于获取待重建表单图像,对所述待重建表单图像进行文本识别,得到所述待重建表单图像中的
N
个文本内容,构建包裹对应文本内容的文本框,从
N
个文本内容中筛选出目标文本及对应所述目标文本的文本框,
N
为大于1的整数;
[0011]划分模块,用于根据所述目标文本的文本框的坐标信息,确定同一行中多个目标文本的文本框组成的行目标文本框,得到不同行对应的行目标文本框,根据所述不同行对应的行目标文本框,将所述待重建表单图像划分为
M
个子表格,针对任一子表格,根据所述子表格中对应的行目标文本框的坐标信息,计算所述行目标文本框的拟合曲线,
M
为大于1的整数;
[0012]构建模块,用于提取与所述目标文本的文本框同列的多个列文本框,针对任一列文本框,根据预设间距,构建所述列文本框对应的有向图,根据所述有向图,确定所述列文本框对应的候选对齐文本框,遍历所有列文本框,得到每个列文本框对应的候选对齐文本框;
[0013]搜索模块,用于针对任一列,确定对应列文本框与候选对齐文本框组成的候选组合,根据预设筛选条件,对所述候选组合进行筛选,得到筛选后的
K
个最优组合,根据预设搜索算法与所述
K
个最优组合,搜索与对应列文本框为同一行的文本框,得到所述列文本框所在行的行文本框,根据所述行文本框中每个文本框中的文本内容,得到所述待重建表单图像中重建后的行文本,
K
为大于1的整数

[0014]第三方面,本申请实施例提供一种终端设备,所述终端设备包括处理器

存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的表格行重建方法

[0015]第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的表格行重建方法

[0016]本专利技术与现有技术相比存在的有益效果是:
[0017]获取待重建表单图像,对待重建表单图像进行文本识别,得到待重建表单图像中的
N
个文本内容,构建包裹对应文本内容的文本框,从
N
个文本内容中筛选出目标文本及对应目标文本的文本框,
N
为大于1的整数,根据目标文本的文本框的坐标信息,确定同一行中多个目标文本的文本框组成的行目标文本框,得到不同行对应的行目标文本框,根据不同行对应的行目标文本框,将待重建表单图像划分为
M
个子表格,针对任一子表格,根据子表格中对应的行目标文本框的坐标信息,计算行目标文本框的拟合曲线,
M
为大于1的整数,提取与目标文本的文本框同列的多个列文本框,针对任一列文本框,根据预设间距,构建列文本框对应的有向图,根据有向图,确定列文本框对应的候选对齐文本框,遍历所有列文本框,得到每个列文本框对应的候选对齐文本框,针对任一列,确定对应列文本框与候选对齐文本框组成的候选组合,根据预设筛选条件,对候选组合进行筛选,得到筛选后的
K
个最优组合,根据预设搜索算法与
K
个最优组合,搜索与对应列文本框为同一行的文本框,得到列文本框所在行的行文本框,根据行文本框中每个文本框中的文本内容,得到待重建表单图像中重建后的行文本,
K
为大于1的整数

本申请本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种表单图像的表格行重建方法,其特征在于,所述表格行重建方法包括:获取待重建表单图像,对所述待重建表单图像进行文本识别,得到所述待重建表单图像中的
N
个文本内容,构建包裹对应文本内容的文本框,从
N
个文本内容中筛选出目标文本及对应所述目标文本的文本框,
N
为大于1的整数;根据所述目标文本的文本框的坐标信息,确定同一行中多个目标文本的文本框组成的行目标文本框,得到不同行对应的行目标文本框,根据所述不同行对应的行目标文本框,将所述待重建表单图像划分为
M
个子表格,针对任一子表格,根据所述子表格中对应的行目标文本框的坐标信息,计算所述行目标文本框的拟合曲线,
M
为大于1的整数;提取与所述目标文本的文本框同列的多个列文本框,针对任一列文本框,根据预设间距,构建所述列文本框对应的有向图,根据所述有向图,确定所述列文本框对应的候选对齐文本框,遍历所有列文本框,得到每个列文本框对应的候选对齐文本框;针对任一列,确定对应列文本框与候选对齐文本框组成的候选组合,根据预设筛选条件,对所述候选组合进行筛选,得到筛选后的
K
个最优组合,根据预设搜索算法与所述
K
个最优组合,搜索与对应列文本框为同一行的文本框,得到所述列文本框所在行的行文本框,根据所述行文本框中每个文本框中的文本内容,得到所述待重建表单图像中重建后的行文本,
K
为大于1的整数
。2.
如权利要求1所述的表格行重建方法,其特征在于,所述对所述待重建表单图像进行文本识别,得到所述待重建表单图像中的
N
个文本内容,包括:对所述待重建表单图像进行文本检测,得到所述待重建表单图像中表征文本的文本区域;对文本区域进行文本识别,得到所述文本区域中文本的文本内容
。3.
如权利要求1所述的表格行重建方法,其特征在于,所述根据所述不同行对应的行目标文本框,将所述待重建表单图像划分为
M
个子表格,包括:针对任一行目标文本框,确定与所述行相邻的相邻行目标文本框,提取所述行目标文本框与所述相邻行目标文本框之间的文本框,所述行目标文本框中文本框的列坐标小于相邻行目标文本框中文本框的列坐标;将所述行目标文本框与所述相邻行目标文本框之间的文本框,以及所述行目标文本框确定为一个子表格,遍历所有行目标文本框,得到
M
个子表格
。4.
如权利要求1所述的表格行重建方法,其特征在于,所述根据所述子表格中对应的行目标文本框的坐标信息,计算所述行目标文本框的拟合曲线,包括:计算行目标文本框中每个目标文本的文本框的中心点坐标;连接每个目标文本的文本框的中心点坐标,得到行目标文本框的拟合曲线
。5.
如权利要求1所述的表格行重建方法,其特征在于,所述根据所述目标文本的文本框的坐标信息,提取与所述目标文本的文本框同列的多个列文本框之后,还包括:计算相邻列文本...

【专利技术属性】
技术研发人员:刘东煜周坤胜
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1