体检报告表格识别方法、装置、设备及介质制造方法及图纸

技术编号:38906236 阅读:12 留言:0更新日期:2023-09-22 14:24
本发明专利技术涉及人工智能技术、图像识别、文字识别、表格识别及智慧医疗技术领域,公开了一种体检报告表格识别方法、装置、设备及介质。本方法包括对待识别体检报告表格图片调整倾斜角度,得到第二矫正图片;若所述第二矫正图片为系统截屏类型的图片,通过深度学习模型对所述第二矫正图片进行表格识别,确定表格识别数据;若所述第二矫正图片为相机拍摄类型的图片,通过文本块空间还原策略对所述第二矫正图片进行所述表格识别,确定所述表格识别数据。本发明专利技术的技术方案提高了体检报告表格识别的准确性。准确性。准确性。

【技术实现步骤摘要】
体检报告表格识别方法、装置、设备及介质


[0001]本专利技术涉及人工智能技术、图像识别、文字识别、表格识别及智慧医疗
,尤其涉及一种体检报告表格识别方法、装置、设备及介质。

技术介绍

[0002]图像表格还原是当前市场上对光学字符识别(OCR,Optical Character Recognition)进行图像识别的衍生应用,对历史的影像资料进行结构化还原是数字化服务的基础。例如在医疗场景中,患者体检报告往往提供的是拍照或截图形式的电子化图片、或者纸质体检报告,自动化表格还原可以快速的帮助业务人员录入图片或者纸质报告中的数据。
[0003]目前业内有很多表格还原的技术,主要技术方案是基于规则的方法与基于统计的方法。但是针对体检报告数据这一单一场景下,更多的是基于统计的方法,例如基于标注数据进行深度学习,来进行表格还原。但是这种方案在纸质报告出现褶皱、倾斜和弯曲等等场景下,通常会出现识别项丢失、识别内容错误以及错行错列等情况,总体识别的准确性不能达到业务需求。

技术实现思路

[0004]本专利技术提供一种体检报告表格识别方法、装置、设备及介质,以解决体检报告表格识别准确性低的技术问题。
[0005]第一方面,本专利技术提供了一种体检报告表格识别方法,包括:
[0006]获取待识别体检报告表格图片;
[0007]对所述待识别体检报告表格图片进行图片文本比对,确定大角度倾斜判断结果;
[0008]根据所述大角度倾斜判断结果对所述待识别体检报告表格图片旋转特定角度,使所述待识别体检报告表格图片倾斜角度小于90度,得到第一矫正图片,其中,所述特定角度为0度、90度、180度和270度中的任一个;
[0009]对所述第一矫正图片进行倾斜角度判断,确定倾斜角度判断结果;
[0010]若所述倾斜角度判断结果大于预设角度,则对所述第一矫正图片进行旋转调整,确定第二矫正图片;若所述倾斜角度判断结果小于或等于所述预设角度,则将所述第一矫正图片作为所述第二矫正图片;
[0011]若所述第二矫正图片为系统截屏类型的图片,通过深度学习模型对所述第二矫正图片进行表格识别,确定表格识别数据;
[0012]若所述第二矫正图片为相机拍摄类型的图片,通过文本块空间还原策略对所述第二矫正图片进行所述表格识别,确定所述表格识别数据。
[0013]第二方面,本专利技术提供了一种体检报告表格识别装置,包括:
[0014]获取模块,用于获取待识别体检报告表格图片;
[0015]矫正模块,用于对所述待识别体检报告表格图片进行图片文本比对,确定大角度
倾斜判断结果;
[0016]还用于根据所述大角度倾斜判断结果对所述待识别体检报告表格图片旋转特定角度,使所述待识别体检报告表格图片倾斜角度小于90度,得到第一矫正图片,其中,所述特定角度为0度、90度、180度和270度中的任一个;
[0017]还用于对所述第一矫正图片进行倾斜角度判断,确定倾斜角度判断结果;
[0018]还用于若所述倾斜角度判断结果大于预设角度,则对所述第一矫正图片进行旋转调整,确定第二矫正图片;若所述倾斜角度判断结果小于或等于所述预设角度,则将所述第一矫正图片作为所述第二矫正图片;
[0019]处理模块,用于若所述第二矫正图片为系统截屏类型的图片,通过深度学习模型对所述第二矫正图片进行表格识别,确定表格识别数据;
[0020]还用于若所述第二矫正图片为相机拍摄类型的图片,通过文本块空间还原策略对所述第二矫正图片进行所述表格识别,确定所述表格识别数据。
[0021]第三方面,本专利技术提供了一种计算机设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述体检报告表格识别方法的步骤。
[0022]第四方面,本专利技术提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述体检报告表格识别方法的步骤。
[0023]上述体检报告表格识别方法、装置、设备及介质所实现的方案中,通过获取待识别体检报告表格图片;对所述待识别体检报告表格图片进行图片文本比对,确定大角度倾斜判断结果;根据所述大角度倾斜判断结果对所述待识别体检报告表格图片旋转特定角度,使所述待识别体检报告表格图片倾斜角度小于90度,得到第一矫正图片,其中,所述特定角度为0度、90度、180度和270度中的任一个。通过确定所述大角度倾斜判断结果,可以将所述体检报告表格图片进行一个初步的角度调整,防止出现体检报告图片文字完全颠倒或者其他角度偏移过大的情况,使所述体检报告表格图片的倾斜角度小于90度。对所述第一矫正图片进行倾斜角度判断,确定倾斜角度判断结果;若所述倾斜角度判断结果大于预设角度,则对所述第一矫正图片进行旋转调整,确定第二矫正图片;若所述倾斜角度判断结果小于或等于所述预设角度,则将所述第一矫正图片作为所述第二矫正图片。通过对所述第一矫正图片进行小角度调整,可以使得倾斜角度小于预设角度,保证后续表格图像识别的准确性。若所述第二矫正图片为系统截屏类型的图片,通过深度学习模型对所述第二矫正图片进行表格识别,确定表格识别数据;若所述第二矫正图片为相机拍摄类型的图片,通过文本块空间还原策略对所述第二矫正图片进行所述表格识别,确定所述表格识别数据。由于系统截屏类型的图片不会出现纸张褶皱、弯曲等情况,因此通过深度学习模型对所述第二矫正图片进行表格识别可以在保证识别效果的前提下提高识别效率。而拍摄的图片由于光线、角度、纸张褶皱等问题,容易出现识别错误,因此通过文本块空间还原策略,在可能存在纸张褶皱、角度扭曲或者光线阴影的情况下,提高所述体检报告表格识别的准确性。基于此,本专利技术提供的体检报告表格识别方法、装置、设备及介质所实现的方案,通过调整所述体检报告表格图片的倾斜角度,并根据系统截屏类图片和相机拍摄类型图片的不同,采用不同的识别策略,既保证了识别效率又提高了识别准确性。
附图说明
[0024]图1是本专利技术一实施例中体检报告表格识别方法的一应用环境示意图;
[0025]图2是本专利技术一实施例中体检报告表格识别方法的一流程示意图;
[0026]图3是本专利技术一实施例中体检报告表格识别装置的一结构示意图;
[0027]图4是本专利技术一实施例中计算机设备的一结构示意图;
[0028]图5是本专利技术一实施例中计算机设备的另一结构示意图。
具体实施方式
[0029]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0030]要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种体检报告表格识别方法,其特征在于,包括:获取待识别体检报告表格图片;对所述待识别体检报告表格图片进行图片文本比对,确定大角度倾斜判断结果;根据所述大角度倾斜判断结果对所述待识别体检报告表格图片旋转特定角度,使所述待识别体检报告表格图片倾斜角度小于90度,得到第一矫正图片,其中,所述特定角度为0度、90度、180度和270度中的任一个;对所述第一矫正图片进行倾斜角度判断,确定倾斜角度判断结果;若所述倾斜角度判断结果大于预设角度,则对所述第一矫正图片进行旋转调整,确定第二矫正图片;若所述倾斜角度判断结果小于或等于所述预设角度,则将所述第一矫正图片作为所述第二矫正图片;若所述第二矫正图片为系统截屏类型的图片,通过深度学习模型对所述第二矫正图片进行表格识别,确定表格识别数据;若所述第二矫正图片为相机拍摄类型的图片,通过文本块空间还原策略对所述第二矫正图片进行所述表格识别,确定所述表格识别数据。2.根据权利要求1所述的体检报告表格识别方法,其特征在于,所述对所述待识别体检报告表格图片进行图片文本比对,确定大角度倾斜判断结果,包括:获取标准文字数据;将所述标准文字数据与所述体检报告内文字进行文本比对,确定所述标准文字数据与所述体检报告内文字之间的倾斜程度;判断所述倾斜程度介于特定范围,得到所述大角度倾斜判断结果,其中,所述特定范围为0

90度、90

180度、180

270度和270

360度中的任一个范围;所述根据所述大角度倾斜判断结果对所述待识别体检报告表格图片旋转0度、或90度、或180度、或270度,使所述待识别体检报告表格图片倾斜角度小于90度,包括:若所述大角度倾斜判断结果为介于0

90度,则对所述待识别体检报告表格图片旋转0度;若所述大角度倾斜判断结果为介于90

180度,则对所述待识别体检报告表格图片旋转90度;若所述大角度倾斜判断结果为介于180

270度,则对所述待识别体检报告表格图片旋转180度;若所述大角度倾斜判断结果为介于270

360度,则对所述待识别体检报告表格图片旋转270度。3.根据权利要求1所述的体检报告表格识别方法,其特征在于,所述对所述第一矫正图片进行倾斜角度判断,确定倾斜角度判断结果,包括:获取所述第一矫正图片的像素点;选取像素值在预设范围内的所述像素点作为有效像素点;将其中一个有效像素点作为第一有效像素点,确定距离所述第一有效像素点最近的所述有效像素点,作为第二有效像素点;通过所述第一有效像素点和所述第二有效像素点确定一条辅助直线;若落在所述辅助直线上的所述有效像素点数量大于预设数量,且所述辅助直线上的所
述有效像素点之间的最远距离大于预设距离,则将所述辅助直线上距离最远的两个有效像素点之间的线段作为辅助线段;跳转至所述将其中一个有效像素点作为第一有效像素点,确定距离所述第一有效像素点最近的所述有效像素点,作为第二有效像素点,重新执行,直至所有有效像素点均作为所述第一有效像素点一次,得到多条所述辅助线段;确定多条所述辅助线段的倾斜角度;根据所述倾斜角度的分布,确定所述倾斜角度判断结果。4.根据权利要求3所述的体检报告表格识别方法,其特征在于,所述根据所述倾斜角度的分布,确定所述倾斜角度判断结果,包括:将0

90度分为多个角度区间,确定所述倾斜角度落在每个所述角度区间内的所述辅助线段数量;将所述辅助线段数量最多的所述角度区间,作...

【专利技术属性】
技术研发人员:李金泉
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1