一种用于对医嘱进行自动提取的系统及应用技术方案

技术编号:24331819 阅读:24 留言:0更新日期:2020-05-29 19:58
本发明专利技术公开了一种用于对医嘱进行自动提取的系统及应用。所述系统,包括:模板生成模块,用于将不同版面类型样本医嘱单进行分类,并按样本医嘱单类型分别获取对应每一类型的有效医嘱信息区域,以生成对应不同类型样本医嘱单的不同类型的医嘱模板;训练模块,用于将所述不同类型样本医嘱单输入至卷积神经网络中训练以获取用于对医嘱单进行分类的神经网络模型;提取模块,用于根据所述用于对医嘱单进行分类的神经网络模型获取的待提取医嘱单的类型匹配其对应类型的医嘱模板,并根据匹配的医嘱模板对所述待提取医嘱单进行待提取区域的定位以及提取处理,以获取提取的有效医嘱信息。由上,本申请能够实现高效准确地对医嘱进行提取。

A system for automatic extraction of medical orders and its application

【技术实现步骤摘要】
一种用于对医嘱进行自动提取的系统及应用
本专利技术涉及模式识别、机器学习、卷积神经网络等
,特别涉及一种用于对医嘱进行自动提取的系统及应用。
技术介绍
在医疗环境中,医嘱单是医生对病人在饮食、用药、化验等方面的指示,对病人的治疗效果起着至关重要的作用。随着如今就医人数的增加及疾病种类的多样化,利用人工进行医疗信息抽取无论在效率与准确率上都表现出了很大的局限性。由于不同医院及科室的医嘱单一般版面不同,缺乏统一出信息的结构标准,难以应用一套统一的结构提取有效的医嘱信息。而如果直接利用现有的光标识别技术对医嘱单图片进行识别,无效的信息同样会被识别而造成不必要的耗时。另一方面,单独的光标识别技术不能保证抽取信息的逻辑性和有效性,容易造成有效信息的缺失或误读。因此,现有技术尚未实现高效准确的对医嘱进行自动提取。因此,目前亟需一种用于对医嘱进行自动提取的系统,以实现高效准确的对医嘱进行自动提取。
技术实现思路
有鉴于此,本申请提供一种用于对医嘱进行自动提取的系统,以实现高效准确的对医嘱进行提取。本申请提供的用于对医嘱信息进行自动提取的系统,包括:模板生成模块,用于将不同版面类型样本医嘱单进行分类,并按样本医嘱单类型分别获取对应每一类型的有效医嘱信息区域,以生成对应不同类型样本医嘱单的不同类型的医嘱模板;训练模块,用于将所述不同类型样本医嘱单输入至卷积神经网络中训练以获取用于对医嘱单进行分类的神经网络模型;提取模块,用于根据所述用于对医嘱单进行分类的神经网络模型获取的待提取医嘱单的类型匹配其对应类型的医嘱模板,并根据匹配的医嘱模板对所述待提取医嘱单进行待提取区域的定位以及提取处理,以获取提取的有效医嘱信息。由上,本申请的自动提取系统可以实现高效准确地对不同类型的医嘱进行自动提取。既克服了现有技术中利用人工进行医嘱提取在效率与可靠性上的局限性的缺陷;又通过本申请的上述各个模块的功能,克服了现有技术中的利用光标识别技术对进行医嘱单提取时,由于需要对医嘱单的全部内容进行识别,相同的信息会被不断重复识别而造成不必要的耗时的缺陷。优选地,所述模板生成模块,具体包括:采集子模块,用于采集不同医院的不同版面类型的样本医嘱单;标注子模块,用于标注出所述样本医嘱单中的有效医嘱信息区域;分类子模块,用于根据已标注的样本医嘱单中的不同版面结构及有效医嘱信息区域所在位置将样本医嘱单分成不同类型的样本医嘱单;记录子模块,用于记录每一类型样本医嘱单的被标注的有效医嘱信息区域的坐标值;模板生成子模块,用于对于每一类型样本医嘱单:根据每一类型样本医嘱单中的每个样本医嘱单的被标注的有效医嘱信息区域的坐标值,将所含面积最大的有效医嘱信息区域作为每一类型样本医嘱单的最终有效医嘱信息区域,并将标注有所述最终有效医嘱信息区域的样本医嘱单作为该类型样本医嘱单的医嘱模板。由上,有利于生成对应不同类型样本医嘱单的不同类型的医嘱模板。其中,模板生成子模块,将所含面积最大的有效医嘱信息区域作为每一类型样本医嘱单的最终的有效医嘱信息区域。有利于保证在医嘱单进行提取处理时,有效医嘱信息能够充分包含在被提取的区域中。优选地,所述模板生成模块,还包括:图像预处理子模块,用于对所述标注子模块标注后的样本医嘱单进行去噪与二值化处理,以获取处理后的样本医嘱单的二值图像。由上,所述去噪处理能够去除与有效医嘱信息无关的噪点,所述二值化处理有利于在对图像做进一步处理时,图像的集合性质只与像素值为0或255的点的位置有关,不再涉及像素的多级值,使处理变得简单,而且数据的处理和压缩量小。优选地,所述训练模块,具体用于:将所述每一类型样本医嘱单及其所述类型输入至卷积神经网络的输入层;所述卷积神经网络的卷积层提取所述样本医嘱单的特征图;所述卷积神经网络的池化层对所述特征图进行压缩,以及用于提取主要特征;所述卷积神经网络的全连接层用于对所述池化层提取的特征进行全连接或者全局平均处理,并进行分类处理以获取用于对医嘱单进行分类的神经网络模型。由上,有利于生成用于针对不同版面类型医嘱单分类和初始待提取区域标注的神经网络模型。其中,将所含面积最大的有效医嘱信息区域作为每一类型医嘱模板的最终的有效医嘱信息区域。有利于保证在对医嘱进行提取处理时,有效医嘱信息能够充分包含在被提取的区域中。优选地,所述提取模块,具体包括:匹配子模块,用于根据所述训练模块获取的神经网络模型获取的待提取医嘱的类型匹配其对应的医嘱模板;标注子模块,用于根据所述医嘱模板对所述带提取医嘱进行初始待提取区域的标注;定位子模块,用于利用图像处理技术,对所述初始待提取区域进行只保留医嘱信息区域的精确定位,以获取精确定位后的待提取区域;提取子模块,用于对每个精确定位后的待提取区域进行单独的提取处理。由上,本申请通过用于针对不同版面类型医嘱的特征提取的神经网络模型获取带提取的医嘱的初始待提取区域,并进一步精确定位及提取。克服了现有技术中的利用光标识别技术对进行医嘱提取时,由于需要对医嘱全部内容进行识别,相同的信息会被不断重复识别而造成不必要的耗时的缺陷。优选地,所述提取子模块,包括:医嘱信息识别子模块,用于识别出所述待提取区域的句段,并使用指定长度的滑动窗口所述句段中的词语进行识别;校正子模块,用于对所述每个滑动窗口中的识别出的词语进行校对编辑操作。由上,有利于实现对医嘱信息的准确有效的提取。优选地,所述校正子模块,具体用于:根据所述每个滑动窗口中的识别出的可能的词语的概率,所述可能的词语按照降序排列,并将概率最高的词语选定为校正后的词语进行输出;或者对于同一原词语编辑得到的相同概率的词语,以编辑距离最小的词语做为校正后的词语进行输出。由上,有利于更好地实现对医嘱信息的准确有效的提取。优选地,所述有效医嘱信息至少包括但不限于以下其一:所需检查的项目及检查时间、饮食指导信息、服药时间及所需忌口。由上,有效医嘱信息可以是上述信息不限于上述信息,还可以是其他的与医嘱有关的信息。基于上述系统,本申请还提供一种对医嘱进行自动提取的方法,包括:A、获取待提取医嘱单;B、对所述待提取医嘱单进行图片质量判定,保留分辨率高于指定阈值的待提取医嘱单;C、对所述待提取医嘱单进行去噪与二值化处理;D、通过所述用于对医嘱单进行分类的神经网络模型对处理后的所述待提取医嘱单进行分类以获取其所属的医嘱单的类型;E、根据所述医嘱单的类型匹配其对应类型的医嘱模板,并据此获取所述待提取医嘱单的初始待提取区域;F、利用图像处理技术,对所述初始待提取区域进行只保留医嘱信息区域的精确定位,以获取精确定位后的待提取区域;G、对所述精确定位后的待提取区域进行提取处理。由上,本申请的上述方法可以实现高效准确地对不同类型的医嘱单进行自动提取。既克服了现有本文档来自技高网...

【技术保护点】
1.一种用于对医嘱信息进行自动提取的系统,其特征在于,包括:/n模板生成模块,用于将不同版面类型样本医嘱单进行分类,并按样本医嘱单类型分别获取对应每一类型的有效医嘱信息区域,以生成对应不同类型样本医嘱单的不同类型的医嘱模板;/n训练模块,用于将所述不同类型样本医嘱单输入至卷积神经网络中训练以获取用于对医嘱单进行分类的神经网络模型;/n提取模块,用于根据所述用于对医嘱单进行分类的神经网络模型获取的待提取医嘱单的类型匹配其对应类型的医嘱模板,并根据匹配的医嘱模板对所述待提取医嘱单进行待提取区域的定位以及提取处理,以获取提取的有效医嘱信息。/n

【技术特征摘要】
1.一种用于对医嘱信息进行自动提取的系统,其特征在于,包括:
模板生成模块,用于将不同版面类型样本医嘱单进行分类,并按样本医嘱单类型分别获取对应每一类型的有效医嘱信息区域,以生成对应不同类型样本医嘱单的不同类型的医嘱模板;
训练模块,用于将所述不同类型样本医嘱单输入至卷积神经网络中训练以获取用于对医嘱单进行分类的神经网络模型;
提取模块,用于根据所述用于对医嘱单进行分类的神经网络模型获取的待提取医嘱单的类型匹配其对应类型的医嘱模板,并根据匹配的医嘱模板对所述待提取医嘱单进行待提取区域的定位以及提取处理,以获取提取的有效医嘱信息。


2.根据权利要求1所述的系统,其特征在于,所述模板生成模块,具体包括:
采集子模块,用于采集不同医院的不同版面类型的样本医嘱单;
标注子模块,用于标注出所述样本医嘱单中的有效医嘱信息区域;
分类子模块,用于根据已标注的样本医嘱单中的不同版面结构及有效医嘱信息区域所在位置将样本医嘱单分成不同类型的样本医嘱单;
记录子模块,用于记录每一类型样本医嘱单的被标注的有效医嘱信息区域的坐标值;
模板生成子模块,用于对于每一类型样本医嘱单:根据每一类型样本医嘱单中的每个样本医嘱单的被标注的有效医嘱信息区域的坐标值,将所含面积最大的有效医嘱信息区域作为每一类型样本医嘱单的最终有效医嘱信息区域,并将标注有所述最终有效医嘱信息区域的样本医嘱单作为该类型样本医嘱单的医嘱模板。


3.根据权利要求2所述的系统,其特征在于,所述模板生成模块,还包括:
图像预处理子模块,用于对所述标注子模块标注后的样本医嘱单进行去噪与二值化处理。


4.根据权利要求3所述的系统,其特征在于,所述训练模块包括输入子模块和一卷积神经网络:
所述输入子模块,用于将所述每一类型样本医嘱单及其所述类型输入至卷积神经网络的输入层;
所述卷积神经网络的卷积层用于提取所述样本医嘱单的特征图;
所述卷积神经网络的池化层用于对所述特征图进行压缩,以及用于提取主要特征;
所述卷积神经网络的全连接层用于对所述池化层提取的特征进行全连接或者全局平均处理,并进行分类处理以获取用于对医嘱单进行分类的神经网络模型。


5.根据权利要求1所述的系统,其特征在于,所述提取模块,具体包括:
匹配子模块,用于根据所述训练模块获取的神经网络模型获取的待提取医嘱的类型匹配其对应的医嘱模...

【专利技术属性】
技术研发人员:罗立刚康悦罗翔凤马丁张天泽
申请(专利权)人:零氪科技北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1