一种基于神经网络的智能病案文字识别的方法技术

技术编号:22975090 阅读:12 留言:0更新日期:2019-12-31 23:34
本发明专利技术提供了一种基于神经网络的智能病案文字识别的方法,本发明专利技术通过新设计的卷积神经网络模块和双层双向神经网络的结合,新的卷及神经网络模块能加深神经网络的深度,将卷积后的特征图进行双层双向神经网络的处理,充分考虑到图片每一切片之间的联系,随着神经网络深度的加深,不会产生梯度消失的问题,还能更好的提取特征,使得本识别算法在通用文本及病案文本的识别准确率上显著提高,特别是比现有的OCR识别病案的准确率高,准确度达到98.3%,其次,本发明专利技术的算法数据集增加医学用词及医学用词训练数据,增加了医学用词的预测能力,再有,本发明专利技术的数据集是通过真实病案数据制作的数据集,能够有效的消除背景的影响。

A method of intelligent medical record character recognition based on Neural Network

【技术实现步骤摘要】
一种基于神经网络的智能病案文字识别的方法
本专利技术涉及医疗病案管理领域,特别是一种基于神经网络的智能病案文字识别的方法。
技术介绍
按规范记录病人疾病表现和诊断情况的档案,由医疗机构的病案管理部门按照相关规定保存。不仅有纸质的,还有电子文档、医学影像、检查胶片、病理切片等保存形式。对于纸质保存的数据,我们需要通过技术手段将里面的数据提取出来通过电子文档的形式保存,用于统计分析和科研任务。对于纸质病案数据的提取,需要用到OCR技术,先对病案进行文字检测,再对检测到的文本行进行文字识别。目前,文字识别技术在病案识别上的缺陷有:1、通用文字识别仅仅只包含常用字的识别,病案中存在很多专业医学词汇。2、通用文字识别方法容易受到病案文本行数据背景的干扰,表现不佳。3、除了数据集包含文字较少外,通用文字识别方法准确率普遍没有达到95%。。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种基于神经网络的智能病案文字识别的方法,以解决上述技术背景中所提出的问题。本专利技术的目的是通过以下技术方案来实现的:一种基于神经网络的智能病案文字识别的方法,其方法包括以下步骤:S1、取病案文本行数据进行标注,标出每个文本行里面所包含的文字,得到病案训练数据;S2、将标注病案训练数据与已有的通过通用文字识别方法识别的文字检测数据一起作为训练数据,并将已有的文字检测数据按照98:1:1的比例分成训练集、测试集和验证集;S3、将训练数据按32x280x3的图片进行灰度处理转换成32x280x1的灰度图,并输入卷积神经网络模型中进行图片的特征提取,生成4x35x192的特征图,然后将特征图进行维度交换35x4x192,再将最后两个维度进行合并35x768的特征图转入双层双向循环神经网络做特征提取,得到特征图的35个切片;S4、利用文本识别模型对特征图的35个切片分别进行分类预测得分;S5、取每一个切片预测得分最高的分类,该分类对应的字即为所预测的字,最后将35个切片的相同字符进行合并,得到10个字符。进一步的,在步骤S1中,每张病案训练数据长宽相同并包含10个文字。进一步的,在步骤S3中,所述特征图的35个切片为35个字或字符的数量。进一步的,在步骤S4中,文本识别模型采用CTC作为损失函数,采用Adam梯度下降优化器进行模型的反向传播,调整神经网络模型参数。本专利技术的有益效果是:(1)本专利技术数据集增加医学用词及医学用词训练数据,增加了医学用词的预测能力;(2)本专利技术由真实病案数据制作的数据集,能够有效的消除背景的影响;(3)本专利技术通过新设计的卷积神经网络模块和双层双向神经网络的结合,使得本专利技术在通用文本及病案文本的识别准确率上显著提高,特别是比现有的OCR识别病案的准确率高,准确度达到98.3%。附图说明图1为本专利技术卷积神经网络模块示意图;图2为本专利技术文本识别模型示意图。具体实施方式以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。实施例:一种基于神经网络的智能病案文字识别的方法,其方法包括以下步骤:S1、取病案文本行数据进行标注,标出每个文本行里面所包含的文字,得到病案训练数据;S2、将标注病案训练数据与已有的通过通用文字识别方法识别的文字检测数据一起作为训练数据,并将已有的文字检测数据按照98:1:1的比例分成训练集、测试集和验证集;S3、将训练数据按32x280x3的图片进行灰度处理转换成32x280x1的灰度图,并输入卷积神经网络模型中进行图片的特征提取,生成4x35x192的特征图,然后将特征图进行维度交换35x4x192,再将最后两个维度进行合并35x768的特征图转入双层双向循环神经网络做特征提取,得到特征图的35个切片;S4、利用文本识别模型对特征图的35个切片分别进行分类预测得分;S5、取每一个切片预测得分最高的分类,该分类对应的字即为所预测的字,最后将35个切片的相同字符进行合并,得到10个字符。进一步的,在步骤S1中,每张病案训练数据长宽相同并包含10个文字。进一步的,在步骤S3中,所述特征图的35个切片为35个字或字符的数量。进一步的,在步骤S4中,文本识别模型采用CTC作为损失函数,采用Adam梯度下降优化器进行模型的反向传播,调整神经网络模型参数。本专利技术通过新设计的卷积神经网络模块和双层双向神经网络的结合,新的卷及神经网络模块能加深神经网络的深度,将卷积后的特征图进行双层双向神经网络的处理,充分考虑到图片每一切片之间的联系,随着神经网络深度的加深,不会产生梯度消失的问题,还能更好的提取特征,使得本识别算法在通用文本及病案文本的识别准确率上显著提高,特别是比现有的OCR识别病案的准确率高,准确度达到98.3%,其次,本专利技术的算法数据集增加医学用词及医学用词训练数据,增加了医学用词的预测能力,最后,本专利技术的数据集是通过真实病案数据制作的数据集,能够有效的消除背景的影响。以上所述实施例仅表达了本专利技术的具体实施方式,其描述较为具体和详细,但并不能因此而理解为对本专利技术专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本专利技术构思的前提下,还可以做出若干变形和改进,这些都属于本专利技术的保护范围。本文档来自技高网...

【技术保护点】
1.一种基于神经网络的智能病案文字识别的方法,其特征在于,包括以下步骤:/nS1、取病案文本行数据进行标注,标出每个文本行里面所包含的文字,得到病案训练数据;/nS2、将标注病案训练数据与已有的通过通用文字识别方法识别的文字检测数据一起作为训练数据,并将已有的文字检测数据按照98:1:1的比例分成训练集、测试集和验证集;/nS3、将训练数据按32x280x3的图片进行灰度处理转换成32x280x1的灰度图,并输入卷积神经网络模块中进行图片的特征提取,生成4x35x192的特征图,然后将特征图进行维度交换35x4x192,再将最后两个维度进行合并35x768的特征图转入双层双向循环神经网络做特征提取,得到特征图的35个切片;/nS4、利用文本识别模型对特征图的35个切片分别进行分类预测得分;/nS5、取每一个切片预测得分最高的分类,该分类对应的字即为所预测的字,最后将35个切片的相同字符进行合并,得到10个字符。/n

【技术特征摘要】
1.一种基于神经网络的智能病案文字识别的方法,其特征在于,包括以下步骤:
S1、取病案文本行数据进行标注,标出每个文本行里面所包含的文字,得到病案训练数据;
S2、将标注病案训练数据与已有的通过通用文字识别方法识别的文字检测数据一起作为训练数据,并将已有的文字检测数据按照98:1:1的比例分成训练集、测试集和验证集;
S3、将训练数据按32x280x3的图片进行灰度处理转换成32x280x1的灰度图,并输入卷积神经网络模块中进行图片的特征提取,生成4x35x192的特征图,然后将特征图进行维度交换35x4x192,再将最后两个维度进行合并35x768的特征图转入双层双向循环神经网络做特征提取,得到特征图的35个切片;
S4、利用文本识别模型对特征图的35个切...

【专利技术属性】
技术研发人员:徐登友董艺航许慧
申请(专利权)人:颐保医疗科技上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1