【技术实现步骤摘要】
体检报告表格识别方法、装置、设备及介质
[0001]本专利技术涉及人工智能技术、图像识别、文字识别、表格识别及智慧医疗
,尤其涉及一种体检报告表格识别方法、装置、设备及介质。
技术介绍
[0002]图像表格还原是当前市场上对光学字符识别(OCR,Optical Character Recognition)进行图像识别的衍生应用,对历史的影像资料进行结构化还原是数字化服务的基础。例如在医疗场景中,患者体检报告往往提供的是拍照或截图形式的电子化图片、或者纸质体检报告,自动化表格还原可以快速的帮助业务人员录入图片或者纸质报告中的数据。
[0003]目前业内有很多表格还原的技术,主要技术方案是基于规则的方法与基于统计的方法。但是针对体检报告数据这一单一场景下,更多的是基于统计的方法,例如基于标注数据进行深度学习,来进行表格还原。但是这种方案在纸质报告出现褶皱、倾斜和弯曲等等场景下,通常会出现识别项丢失、识别内容错误以及错行错列等情况,总体识别的准确性不能达到业务需求。
技术实现思路
[0004]本专利技术提供一种体检报告表格识别方法、装置、设备及介质,以解决体检报告表格识别准确性低的技术问题。
[0005]第一方面,本专利技术提供了一种体检报告表格识别方法,包括:
[0006]获取待识别体检报告表格图片;
[0007]对所述待识别体检报告表格图片进行图片文本比对,确定大角度倾斜判断结果;
[0008]根据所述大角度倾斜判断结果对所述待识别体检报告表格图片旋转特定角 ...
【技术保护点】
【技术特征摘要】
1.一种体检报告表格识别方法,其特征在于,包括:获取待识别体检报告表格图片;对所述待识别体检报告表格图片进行图片文本比对,确定大角度倾斜判断结果;根据所述大角度倾斜判断结果对所述待识别体检报告表格图片旋转特定角度,使所述待识别体检报告表格图片倾斜角度小于90度,得到第一矫正图片,其中,所述特定角度为0度、90度、180度和270度中的任一个;对所述第一矫正图片进行倾斜角度判断,确定倾斜角度判断结果;若所述倾斜角度判断结果大于预设角度,则对所述第一矫正图片进行旋转调整,确定第二矫正图片;若所述倾斜角度判断结果小于或等于所述预设角度,则将所述第一矫正图片作为所述第二矫正图片;若所述第二矫正图片为系统截屏类型的图片,通过深度学习模型对所述第二矫正图片进行表格识别,确定表格识别数据;若所述第二矫正图片为相机拍摄类型的图片,通过文本块空间还原策略对所述第二矫正图片进行所述表格识别,确定所述表格识别数据。2.根据权利要求1所述的体检报告表格识别方法,其特征在于,所述对所述待识别体检报告表格图片进行图片文本比对,确定大角度倾斜判断结果,包括:获取标准文字数据;将所述标准文字数据与所述体检报告内文字进行文本比对,确定所述标准文字数据与所述体检报告内文字之间的倾斜程度;判断所述倾斜程度介于特定范围,得到所述大角度倾斜判断结果,其中,所述特定范围为0
‑
90度、90
‑
180度、180
‑
270度和270
‑
360度中的任一个范围;所述根据所述大角度倾斜判断结果对所述待识别体检报告表格图片旋转0度、或90度、或180度、或270度,使所述待识别体检报告表格图片倾斜角度小于90度,包括:若所述大角度倾斜判断结果为介于0
‑
90度,则对所述待识别体检报告表格图片旋转0度;若所述大角度倾斜判断结果为介于90
‑
180度,则对所述待识别体检报告表格图片旋转90度;若所述大角度倾斜判断结果为介于180
‑
270度,则对所述待识别体检报告表格图片旋转180度;若所述大角度倾斜判断结果为介于270
‑
360度,则对所述待识别体检报告表格图片旋转270度。3.根据权利要求1所述的体检报告表格识别方法,其特征在于,所述对所述第一矫正图片进行倾斜角度判断,确定倾斜角度判断结果,包括:获取所述第一矫正图片的像素点;选取像素值在预设范围内的所述像素点作为有效像素点;将其中一个有效像素点作为第一有效像素点,确定距离所述第一有效像素点最近的所述有效像素点,作为第二有效像素点;通过所述第一有效像素点和所述第二有效像素点确定一条辅助直线;若落在所述辅助直线上的所述有效像素点数量大于预设数量,且所述辅助直线上的所
述有效像素点之间的最远距离大于预设距离,则将所述辅助直线上距离最远的两个有效像素点之间的线段作为辅助线段;跳转至所述将其中一个有效像素点作为第一有效像素点,确定距离所述第一有效像素点最近的所述有效像素点,作为第二有效像素点,重新执行,直至所有有效像素点均作为所述第一有效像素点一次,得到多条所述辅助线段;确定多条所述辅助线段的倾斜角度;根据所述倾斜角度的分布,确定所述倾斜角度判断结果。4.根据权利要求3所述的体检报告表格识别方法,其特征在于,所述根据所述倾斜角度的分布,确定所述倾斜角度判断结果,包括:将0
‑
90度分为多个角度区间,确定所述倾斜角度落在每个所述角度区间内的所述辅助线段数量;将所述辅助线段数量最多的所述角度区间,作...
【专利技术属性】
技术研发人员:李金泉,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。