一种病历电子数据识别方法及系统技术方案

技术编号:11868053 阅读:120 留言:0更新日期:2015-08-12 17:03
本发明专利技术公开了一种病历电子数据识别方法及系统,在应用病历电子数据识别方式时,通过建立病历模板,将病历图像中的关键医学词汇信息对应的检验结果填充到病历模板中,由于病历模板中包含有关键医学词汇信息,将检验结果填充到病历模板中关键医学词汇信息的框架下,输出病历电子数据,同时提高了识别速度和准确率。

【技术实现步骤摘要】

本专利技术涉及移动医疗
,更具体的说,涉及一种病历电子数据识别方法及系统
技术介绍
中国病历记录已由手写记录发展到由医院信息系统出具的格式规范的打印报告。完全的电子病历保存着所有的病历数据,包括医生写入的病历数据、病程记录、从医疗设备收集到的医学影像图形、各种检查检验数据以及ICU设备的当前图形和历史数据。但是,所有的数据信息仅留存在各医院的信息系统中,病人无法查阅自己的病史信息。由于病人对病史信息化、电子化需求很强,因此需要将电子病历以更便捷、移动的方式呈现给病人。目前,在移动医疗软件中处理纸质数据的方案通常有两种,一种方法是人工录入,即通过手工录入的方式将纸质病历报告表内容输入计算机中形成电子病历报告表,对临床数据进行统计分析。然而,一份病历图像的工作流程需要24-48小时。虽然准确率较高,但面对海量输入需求和效率的考虑,该方案显然不能满足移动医疗行业日益增长的需求。第二种方法是普通的OCR识别,将病历图像向电子媒体转移,运用传统的OCR识别软件对病历图像进行识别并将病历图像转换为计算机可识别和处理的文本信息。然而,普通的OCR识别虽然能够解决人工输入效率低的问题,但是未针对医学文书识别进行优化,不能根据病历图像结构化提取病历图像中的数据信息,加上医学文书的特点,中文、英文、数字、拉丁文混排较多,加之不同医院具有不同的病历格式及字体,故导致整体识别率很低。医学文书因其特殊性,对准确度要求极高,故该解决方案无法满足需求。因此,现有技术中的病历数据识别方法均无法将病历图像中的数据信息结构化输出,同时无法既准确又高效的转换为病历电子数据。【
技术实现思路
】有鉴于此,本专利技术提供了一种病历电子数据识别方法及系统,能够将病历图像中的数据信息机构化输出,同时提高识别效率和准确率。为了实现上述目的,本专利技术提供了一种病历电子数据识别方法,包括:获取病历图像;抓取所述病历图像中的一个或多个关键医学词汇信息,所述关键医学词汇信息对应检验结果;检索包含有所述关键医学词汇信息的病历模板,选择与所述病历图像中的所述关键医学词汇信息相匹配的所述病历模板;将所述病历图像中的所述检验结果填充到所选择的所述病历模板对应的所述关键医学词汇信息中,输出病历电子数据。 优选地,在上述方法中,所述抓取所述病历图像中的一个或多个关键医学词汇信息进一步包括:提取医学信息数据库;判断所述医学信息数据库中是否存在所述病历图像中的关键医学词汇信息;若不存在,则将所述病历图像中的关键医学词汇信息补充到所述医学信息数据库中,或将所述病历图像中的关键医学词汇信息与所述医学信息库中与之相似的关键医学词汇信息进行关联,或根据所述病历图像中的关键医学词汇信息修正所述医学信息数据库中的错别字;根据所述医学信息数据库抓取所述病历图像中的一个或多个关键医学词汇信息。优选地,在上述方法中,所述病历模板包括病历文书结构化模板和病历框架结构化模板,所述病历文书结构化模板用于提取所述病历图像中的文字检验结果,所述病历框架结构化模板用于提取所述病历图像中的数字检验结果。优选地,在上述方法中,所述获取病历图像具体包括:根据病历图像的获取顺序,获取待分检队列;将所述待分检队列进行分检,判断所述病历图像是否合格;获取合格的所述病历图像。本专利技术还提供一种病历电子数据识别系统,所述系统包括:获取模块,用于获取病历图像以及抓取所述病历图像中的一个或多个关键医学词汇信息;检索模块,用于检索包含有所述关键医学词汇信息的病历模板;选择模块,用于选择与所述病历图像中的所述关键医学词汇信息相匹配的所述病历模板;输出模块,用于将所述病历图像中的所述检验结果填充到所选择的所述病历模板中,输出病历电子数据。优选地,在上述系统中,还包括:判断模块,用于判断所述医学信息数据库中是否存在所述病历图像中的关键医学词汇信息;扩充模块,用于将所述病历图像中的关键医学词汇信息补充到所述医学信息数据库中;关联模块,用于将所述病历图像中的关键医学词汇信息与所述医学信息库中与之相似的关键医学词汇信息进行关联;纠错模块,用于根据所述病历图像中的关键医学词汇信息修正所述医学信息数据库中的错别字。为了解决现有技术问题,本专利技术提供了一种病历电子数据识别方法,包括:获取病历图像;抓取所述病历图像中的一个或多个关键医学词汇信息,所述关键医学词汇信息对应检验结果;检索包含有所述关键医学词汇信息的病历模板,选择与所述病历图像中的所述关键医学词汇信息相匹配的所述病历模板;将所述病历图像中的所述检验结果填充到所选择的所述病历模板对应的所述关键医学词汇信息中,输出病历电子数据。随着获取病历图像的数量的增加,病历图像中关键医学词汇信息对应的检验结果也随之大量增加,抓取的大量检验结果并不能结构化输出,不利于有关人员对大量的病历图像中的内容进行归类整理以便于研宄,本专利技术建立了病历模板,将病历图像中的关键医学词汇信息对应的检验结果填充到病历模板中,由于病历模板中包含有关键医学词汇信息,将检验结果填充到病历模板中关键医学词汇信息的框架下,输出病历电子数据,提高了识别率。在一种优选的实施方式中,本专利技术提供的病历电子数据识别方法中所述抓取所述病历图像中的一个或多个关键医学词汇信息进一步包括:提取医学信息数据库;判断所述医学信息数据库中是否存在所述病历图像中的关键医学词汇信息;若不存在,则将所述病历图像中的关键医学词汇信息补充到所述医学信息数据库中,或将所述病历图像中的关键医学词汇信息与所述医学信息库中与之相似的关键医学词汇信息进行关联,或根据所述病历图像中的关键医学词汇信息修正所述医学信息数据库中的错别字;根据所述医学信息数据库抓取所述病历图像中的一个或多个关键医学词汇信息。通过医学信息数据库的自我学习过程,即在用户不断的输入关键医学词汇信息过程中,医学信息数据库在不断的扩充自身所包含的关键医学词汇信息的数量,增加新的关键医学词汇信息,在下一次的病历电子数据的识别过程中会自动调用关键医学词汇信息,不需要重复输入,提高了识别的速度,并且修正了医学信息数据库中关键医学词汇信息所包含的错误,例如修改医学信息数据库中的错别字,提高了识别的速度和准确率。【附图说明】为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本专利技术实施例提供的一种病历数据识别方法示意图。【具体实施方式】下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。由于现有技术中的病历数据识别方法均无法将病历纸质数据既准确又高效的转换为病历电子数据,因此本专利技术提供一种病历电子数据识别方法,能够准确高效的将病历纸质数据转换为病历电子数据。请参阅图1,图1为本专利技术实施例提供的一种病历数据识别方法示意图。在一种具体的实施方式中,提供一种病历数据识别方法,具体包括以下步骤:步骤SO本文档来自技高网
...

【技术保护点】
一种病历电子数据识别方法,其特征在于,包括:获取病历图像;抓取所述病历图像中的一个或多个关键医学词汇信息,所述关键医学词汇信息对应检验结果;检索包含有所述关键医学词汇信息的病历模板,选择与所述病历图像中的所述关键医学词汇信息相匹配的所述病历模板;将所述病历图像中的所述检验结果填充到所选择的所述病历模板对应的所述关键医学词汇信息中,输出病历电子数据。

【技术特征摘要】

【专利技术属性】
技术研发人员:熊超
申请(专利权)人:上海翼依信息技术有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1