一种基于深度神经网络的体检单识别方法和系统技术方案

技术编号:26260027 阅读:28 留言:0更新日期:2020-11-06 17:55
本发明专利技术提供的一种基于深度神经网络的体检单识别方法和系统,对完成体检项目的纸质体检单进行图像扫描,获取体检单图像;对体检单图像进行预处理;获取预处理后的体检图像的目标区域图像;利用训练完毕的卷积循环神经网络对目标区域图像进行文字识别,输出识别结果;根据识别结果生成电子体检单。卷积循环神经网络包括卷积层、循环层和转录层,卷积层使用卷积神经网络,循环层使用循环神经网络,转录层使用连接时序分类算法计算损失。提高体检项目填写识别率,成本低,效率快,应用广泛。

【技术实现步骤摘要】
一种基于深度神经网络的体检单识别方法和系统
本专利技术涉及一种识别
,尤其涉及一种基于深度神经网络的体检单识别方法和系统。
技术介绍
现有技术中的体检单识别通常是基于OCR的轮廓识别,OCR识别无法解决手写数字和手写汉字的识别。需要采用一种技术解决难以识别手写字符的问题。
技术实现思路
本专利技术提供的一种基于深度神经网络的体检单识别方法和系统,旨在解决现有技术中识别手写数字和手写汉字困难的技术问题。一种基于深度神经网络的体检单识别方法,包括以下步骤:步骤A1,对完成体检项目的纸质体检单进行图像扫描,获取体检单图像;步骤A2,对体检单图像进行预处理;步骤A3,获取预处理后的体检图像的目标区域图像和非目标区域图像;步骤A4,利用训练完毕的卷积循环神经网络对目标区域图像进行文字识别,输出文字识别结果;步骤A5,对非目标区域图像进行定位和文字识别;步骤A6,根据对目标区域图像和非目标区域图像的文字识别结果生成电子体检单。进一步的,步骤A2中预处理包括:步骤A21,对体检单图像进行灰度化;步骤A22,对灰度化后的体检单图像进行二值化。进一步的,步骤A3包括:步骤A31,对预处理后的体检单图像进行分割获取多个勾选区域图像,对勾选区域图像进行定位;步骤A32,检测勾选区域图像是否存在矩形勾选框轮廓;步骤A33,若勾选区域图像不存在矩形勾选框轮廓,则将勾选区域图像对应的体检项目标识为已被勾选,目标区域图像是指体检项目被标识为已被勾选的勾选区域图像。进一步的,在步骤A33中,若勾选区域图像存在矩形勾选框轮廓,则将勾选区域图像对应的体检项目标识为未被勾选,非目标区域图像是指体检项目被标识为未被勾选的勾选区域图像。进一步的,步骤A4包括:步骤A41,构建卷积循环神经网络,卷积循环神经网络包括卷积层、循环层和转录层;步骤A42,将预先已经存在的真实体检数据生成数据集作为训练样本,对卷积循环神经网络进行训练;步骤A43,将目标区域图像输入训练完成的卷积循环神经网络的卷积层,在卷积层中提取文字特征序列输出至循环层;步骤A44,在循环层预测文字特征序列的标签值,输出至转录层;步骤A45,在转录层将标签值通过去重整合操作转换成对应的文字。进一步的,卷积层使用卷积神经网络,循环层使用循环神经网络,转录层使用连接时序分类算法计算损失。进一步的,连接时序分类算法的损失函数定义公式如下所示:其中,其中,|z′|表示z对应的在标签收尾以及中间插入空白节点后的标签长度U’,α(t,u)β(t,u)表示t时刻经过节点u的所有路径的概率和。进一步的,目标区域图像为手写数字和/或手写文字对应的区域。一种基于深度神经网络的体检单识别系统,包含前述的一种基于深度神经网络的体检单识别方法。本专利技术的有益技术效果是:提高体检项目填写识别率,成本低,效率快,本专利技术除了能够识别勾选项外,对手写字符也具有很高的识别率,勉去了繁重的人工处理体检数据的工作,减少了人为因素导致的数据错误问题。附图说明图1为本专利技术的一种基于深度神经网络的体检单识别方法的整体步骤流程图;图2为本专利技术的一种基于深度神经网络的体检单识别方法中预处理的步骤流程图;图3为本专利技术的一种基于深度神经网络的体检单识别方法提取目标区域图像的步骤流程图;图4为本专利技术的一种一种基于深度神经网络的体检单识别方法使用神经网络具体文字识别步骤流程图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明的是,在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。下面结合附图和具体实施例对本专利技术作进一步说明,但不作为本专利技术的限定。参见图1,本专利技术提供一种基于深度神经网络的体检单识别方法,包括以下步骤:步骤A1,对完成体检项目的纸质体检单进行图像扫描,获取体检单图像;步骤A2,对体检单图像进行预处理;步骤A3,获取预处理后的体检图像的目标区域图像和非目标区域图像;步骤A4,利用训练完毕的卷积循环神经网络对目标区域图像进行文字识别,输出文字识别结果;步骤A5,对非目标区域图像进行定位和文字识别;步骤A6,根据对目标区域图像和非目标区域图像的文字识别结果生成电子体检单。参见图2,进一步的,步骤A2中预处理包括:步骤A21,对体检单图像进行灰度化;步骤A22,对灰度化后的体检单图像进行二值化。参见图3,进一步的,步骤A3包括:步骤A31,对预处理后的体检单图像进行分割获取多个勾选区域图像,对勾选区域图像进行定位;步骤A32,检测勾选区域图像是否存在矩形勾选框轮廓;步骤A33,若勾选区域图像不存在矩形勾选框轮廓,则将勾选区域图像对应的体检项目标识为已被勾选,目标区域图像是指体检项目被标识为已被勾选的勾选区域图像。进一步的,在步骤A33中,若勾选区域图像存在矩形勾选框轮廓,则将勾选区域图像对应的体检项目标识为未被勾选。非目标区域图像是指体检项目被标识为未被勾选的勾选区域图像。参见图4,进一步的,步骤A4中对卷积循环神经网络的训练包括:步骤A41,构建卷积循环神经网络,卷积循环神经网络包括卷积层、循环层和转录层;步骤A42,将预先已经存在的真实体检数据生成数据集作为训练样本,对卷积循环神经网络进行训练;步骤A43,将目标区域图像输入训练完成的卷积循环神经网络的卷积层,在卷积层中提取文字特征序列输出至循环层;步骤A44,在循环层预测文字特征序列的标签值,输出至转录层;步骤A45,在转录层将标签值通过去重整合操作转换成对应的文字。进一步的,卷积层使用卷积神经网络(CNN),循环层使用循环神经网络(RNN),转录层使用连接时序分类算法(CTC)计算损失。进一步的,连接时序分类算法的损失函数定义公式如下所示:其中,其中,|z′|表示z对应的在标签收尾以及中间插入空白节点后的标签长度U’,α(t,u)β(t,u)表示t时刻经过节点u的所有路径的概率和。进一步的,目标区域图像为手写数字和/或手写文字对应的区域。CNN卷积神经网络模型如下表所示:其中,体检单的项目如下表所示:本专利技术还提供一种基于深度神经网络的体检单识别系统,包含前述的一种基于深度神经网络的体检单识别方法。本专利技术提供的一种基于深度神经网络的体检单识别方法和系统。提高体检项目填写识本文档来自技高网...

【技术保护点】
1.一种基于深度神经网络的体检单识别方法,其特征在于,包括以下步骤:/n步骤A1,对完成体检项目的纸质体检单进行图像扫描,获取体检单图像;/n步骤A2,对所述体检单图像进行预处理;/n步骤A3,获取预处理后的所述体检图像的目标区域图像和非目标区域图像;/n步骤A4,利用训练完毕的卷积循环神经网络对所述目标区域图像进行文字识别,输出文字识别结果;/n步骤A5,对非目标区域图像进行定位和文字识别;/n步骤A6,根据对所述目标区域图像和所述非目标区域图像的文字识别结果生成电子体检单。/n

【技术特征摘要】
1.一种基于深度神经网络的体检单识别方法,其特征在于,包括以下步骤:
步骤A1,对完成体检项目的纸质体检单进行图像扫描,获取体检单图像;
步骤A2,对所述体检单图像进行预处理;
步骤A3,获取预处理后的所述体检图像的目标区域图像和非目标区域图像;
步骤A4,利用训练完毕的卷积循环神经网络对所述目标区域图像进行文字识别,输出文字识别结果;
步骤A5,对非目标区域图像进行定位和文字识别;
步骤A6,根据对所述目标区域图像和所述非目标区域图像的文字识别结果生成电子体检单。


2.如权利要求1所述的一种基于深度神经网络的体检单识别方法,其特征在于,所述步骤A2中所述预处理包括:
步骤A21,对所述体检单图像进行灰度化;
步骤A22,对灰度化后的所述体检单图像进行二值化。


3.如权利要求1所述的一种基于深度神经网络的体检单识别方法,其特征在于,所述步骤A3包括:
步骤A31,对预处理后的体检单图像进行分割获取多个勾选区域图像,对所述勾选区域图像进行定位;
步骤A32,检测所述勾选区域图像是否存在矩形勾选框轮廓;
步骤A33,若所述勾选区域图像不存在矩形勾选框轮廓,则将所述勾选区域图像对应的体检项目标识为已被勾选,所述目标区域图像是指体检项目被标识为已被勾选的所述勾选区域图像。


4.如权利要求3所述的一种基于深度神经网络的体检单识别方法,其特征在于,在所述步骤A33中,若所述勾选区域图像存在矩形勾选框轮廓,则将所述勾选区域图像对应的体检项目标识为未被勾选,所述非目标区域图像是指体检项目被标识为未被勾选的所述...

【专利技术属性】
技术研发人员:丁洋洋
申请(专利权)人:上海瑞美锦鑫健康管理有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1