电子病历文书数据处理方法、装置及计算机可读存储介质制造方法及图纸

技术编号:27476362 阅读:15 留言:0更新日期:2021-03-02 17:44
本申请公开了一种电子病历文书数据处理方法、装置及计算机可读存储介质。其中,方法包括对待处理电子病历文书进行数据预处理,得到满足预设文件筛选条件的标准病历文书。调用后结构化模型对标准病历文书进行段落切分,段落主题识别和实体属性关系抽取,得到初始后结构化解析数据;后结构化模型预先利用与医院信息化系统封装方法兼容的封装方法进行封装,并设置应用程序服务接口。根据待处理电子病历文书的文书类型和业务需求信息对初始后结构化解析数据进行解析,解决了相关技术中后结构化效率不高的问题,有效地提高电子病历文书后结构化解析效率和结果准确度,还能够支持医院信息化系统的本地化部署,能够在医院信息化系统中快速部署和迭代。快速部署和迭代。快速部署和迭代。

【技术实现步骤摘要】
电子病历文书数据处理方法、装置及计算机可读存储介质


[0001]本申请涉及计算机
,特别是涉及一种电子病历文书数据处理方法、装置及计算机可读存储介质。

技术介绍

[0002]随着计算机技术在各行各业的广泛应用,医院的信息化管理也逐渐渗透至日常工作中的方方面面,这就导致医院历年来积攒了大量的、具有很大使用、参考价值的病历文书数据。但是,病历文书数据的数据量巨大,结构化程度不高,版本差异大,医院间不同系统间数据格式差异较大等因素导致挖掘和分析利用的难度较高。
[0003]病历结构化是医院信息化和医疗智能化发展的重要环节,是使计算机能像医生一样进行诊断和判断的基础。电子病历文书的后结构化是对医生书写的文本型非结构化数据进行事后处理,利用自然语言处理方法,从中提取结构化信息,并在电子病历模板中进行填充。总结来说,首先要有某种结构化的电子病历规范或称为模板,先由医生来填写;再通过后结构化,从医生写的病历中抽取相应的信息来填写。相关技术在对病历结构化过程中,是直接针对全文本进行后结构化,而由于电子病历文书中不同段落差异较大,而且一般来说医院前些年的电子病历系统没有对段落进行很好的界定,全文本结构化的效果并不好,无法满足精度要求。在从病历中抽取信息时通常可采用机器学习模型,由于病历文书数据具有较高的隐私性,这些数据不能出院,因此常规的训练模型解析结果过程需要迁移到医院本地信息化系统上去。常用的实体属性抽取模型通常基于多任务学习,同时进行实体属性识别以及关系抽,该模型一般需要较大的数据量而且采用比较新颖的NLP预训练模型fine-tuning模式,需要较多的训练时间才能达到较好的效果,但达到医院需求的高精度尚有不少的差距,而且还有关键的一点是复杂的模型预测时间长,对于医院系统性能也有一定的要求,在解析千万级别的电子病历文书上,需要的时间更加长,导致整个后结构化处理周期很长,效率较低。此外,相关技术的电子病历文书结构化后,与医院本地信息化系统不兼容,不支持医院本地信息化系统实际部署及应用。

技术实现思路

[0004]本申请提供了一种电子病历文书数据处理方法、装置及计算机可读存储介质,解决了相关技术中后结构化效率不高的问题,有效地提高电子病历文书后结构化解析效率和结果准确度,还能够支持医院信息化系统的本地化部署,能够在医院信息化系统中快速部署和迭代。
[0005]为解决上述技术问题,本专利技术实施例提供以下技术方案:
[0006]本专利技术实施例一方面提供了一种电子病历文书数据处理方法,包括:
[0007]对待处理电子病历文书进行数据预处理,得到满足预设文件筛选条件的标准病历文书;
[0008]调用后结构化模型对所述标准病历文书进行段落切分,段落主题识别和实体属性
关系抽取,得到初始后结构化解析数据;所述后结构化模型预先利用与医院信息化系统封装方法兼容的封装方法进行封装,并设置应用程序服务接口;
[0009]根据所述待处理电子病历文书的文书类型和业务需求信息对所述初始后结构化解析数据进行解析。
[0010]可选的,所述根据所述待处理电子病历文书的文书类型和业务需求信息对所述初始后结构化解析数据进行解析之后,还包括:
[0011]基于预先设置的数据库解析结果表结构,对所述初始后结构化解析数据的解析结果进行格式转化;
[0012]将转化后的解析结果存储至相应数据库中。
[0013]可选的,所述后结构化模型包括病历文书段落切分模型、段落主题识别模型和实体属性关系模型;所述段落主题识别模型和所述实体属性关系模型采用tensorflow-serving框架;
[0014]其中,所述病历文书段落切分模型基于识别的段落开始和/或结束标志对所述标准病历文书进行段落切分;
[0015]所述段落主题识别模型基于医学专业词库识别各段落的类别;
[0016]所述实体属性关系模型包括实体属性识别模型和关系抽取模型,所述实体属性识别模型用于识别各段落中的实体信息和属性信息,所述关系抽取模型用于按照医学逻辑构建规则形成实体-属性关系对。
[0017]可选的,所述后结构化模型还包括属性关系对过滤模块;
[0018]所述属性关系对过滤模块用于利用医学知识图谱对所述实体属性关系模型输出的所有实体-属性关系对进行过滤,剔除不符合医学逻辑的实体-属性关系对。
[0019]可选的,所述后结构化模型还包括前优化模块、模型结果修正模块和链接模块;
[0020]所述前优化模块用于按照预设规则对所述病历文书段落切分模型和/或所述段落主题识别模型和/或所述实体属性关系模型的训练样本数据格式进行处理;
[0021]所述模型结果修正模块用于根据预设标准要求对所述病历文书段落切分模型和/或所述段落主题识别模型和/或所述实体属性关系模型的输出结果进行校正;
[0022]所述链接模块用于按照所述后结构化模型的数据处理流程将各所述前优化模块、所述病历文书段落切分模型、所述段落主题识别模型、所述实体属性关系模型和所述模型结果修正模块进行链接和整合。
[0023]可选的,所述根据所述待处理电子病历文书的文书类型和业务需求信息对所述初始后结构化解析数据进行解析包括:
[0024]从所述后结构化模型的应用程序接口读取解析数据字符串;
[0025]根据所述业务需求信息从所述解析数据字符串中提取相应目标指标数据;
[0026]调用与所述目标指标数据相匹配的文书格式模板对所述目标指标数据进行解析,得到初始解析结果。
[0027]可选的,所述调用与所述目标指标数据相匹配的文书格式模板对所述目标指标数据进行解析之后,还包括:
[0028]对所述初始解析结果进行优化处理操作,所述优化处理操作包括以下任意一项或任意组合:
[0029]段落类型的错误修正、添加段落更新标识、生成日志记录。
[0030]本专利技术实施例另一方面提供了一种电子病历文书数据处理装置,包括:
[0031]数据预处理模块,用于对待处理电子病历文书进行数据预处理,得到满足预设文件筛选条件的标准病历文书;
[0032]后结构化处理模块,用于调用后结构化模型对所述标准病历文书进行段落切分,段落主题识别和实体属性关系抽取,得到初始后结构化解析数据;所述后结构化模型预先利用与医院信息化系统封装方法兼容的封装方法进行封装,并设置应用程序服务接口;
[0033]再解析模块,用于根据所述待处理电子病历文书的文书类型和业务需求信息对所述初始后结构化解析数据进行解析。
[0034]本专利技术实施例还提供了一种电子病历文书数据处理装置,包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如前任一项所述电子病历文书数据处理方法的步骤。
[0035]本专利技术实施例最后还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有电子病历文书数据处理程序,所述电子病历文书数据处理程序被处理器执行时实现如前任一项所述电子病历文书数据处理方法本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种电子病历文书数据处理方法,其特征在于,包括:对待处理电子病历文书进行数据预处理,得到满足预设文件筛选条件的标准病历文书;调用后结构化模型对所述标准病历文书进行段落切分,段落主题识别和实体属性关系抽取,得到初始后结构化解析数据;所述后结构化模型预先利用与医院信息化系统封装方法兼容的封装方法进行封装,并设置应用程序服务接口;根据所述待处理电子病历文书的文书类型和业务需求信息对所述初始后结构化解析数据进行解析。2.根据权利要求1所述的电子病历文书数据处理方法,其特征在于,所述根据所述待处理电子病历文书的文书类型和业务需求信息对所述初始后结构化解析数据进行解析之后,还包括:基于预先设置的数据库解析结果表结构,对所述初始后结构化解析数据的解析结果进行格式转化;将转化后的解析结果存储至相应数据库中。3.根据权利要求1所述的电子病历文书数据处理方法,其特征在于,所述后结构化模型包括病历文书段落切分模型、段落主题识别模型和实体属性关系模型;所述段落主题识别模型和所述实体属性关系模型采用tensorflow-serving框架;其中,所述病历文书段落切分模型基于识别的段落开始和/或结束标志对所述标准病历文书进行段落切分;所述段落主题识别模型基于医学专业词库识别各段落的类别;所述实体属性关系模型包括实体属性识别模型和关系抽取模型,所述实体属性识别模型用于识别各段落中的实体信息和属性信息,所述关系抽取模型用于按照医学逻辑构建规则形成实体-属性关系对。4.根据权利要求3所述的电子病历文书数据处理方法,其特征在于,所述后结构化模型还包括属性关系对过滤模块;所述属性关系对过滤模块用于利用医学知识图谱对所述实体属性关系模型输出的所有实体-属性关系对进行过滤,剔除不符合医学逻辑的实体-属性关系对。5.根据权利要求3所述的电子病历文书数据处理方法,其特征在于,所述后结构化模型还包括前优化模块、模型结果修正模块和链接模块;所述前优化模块用于按照预设规则对所述病历文书段落切分模型和/或所述段落主题识别模型和/或所述实体属性关系模型的训练样本数据格式进行处理;所述模型结果修正模块用于根据预设标准要...

【专利技术属性】
技术研发人员:何国平尹伟东王旭英甄化春郭亚强
申请(专利权)人:医惠科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1