System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种用于非结构化电子病历的数据清洗方法及系统技术方案_技高网

一种用于非结构化电子病历的数据清洗方法及系统技术方案

技术编号:40871696 阅读:2 留言:0更新日期:2024-04-08 16:39
本发明专利技术公开了一种用于非结构化电子病历的数据清洗方法及系统,涉及数据处理技术领域,解决了现有技术中非结构化电子病历包含的信息复杂多样,对医生诊断查看历史病历时带来不便,可能导致的误诊、迟诊和医保DRG入组错误等技术问题;包括中枢处理模块、数据采集模块和储存模块;中枢处理模块:基于检查检验信息和其对应检查图片生成检查数据;对患者必要信息和诊断必要信息进行数据清洗补偿;对患者其他信息和诊断其他信息进行数据清洗;基于检查数据、重组信息一和重组信息二生成整合数据包和相应的标号;本发明专利技术通过将病历文书中的内容进行分类清洗,使得重要的数据能够尽可能的得到完善和保留;非重要信息部分保留。

【技术实现步骤摘要】

本专利技术属于数据处理领域,涉及数据处理技术,具体是一种用于非结构化电子病历的数据清洗方法及系统


技术介绍

1、临床决策支持系统在医疗领域的应用越来越广泛,它可以帮助医生进行诊断和治疗。非结构化电子病历可以作为临床决策支持系统的重要数据来源,通过对患者病情的全面记录和分析,为医生提供更加准确和个性化的诊断和治疗方案。在医疗领域,数据的共享和互操作性非常重要。非结构化电子病历可以通过标准化和格式化的方式,将患者的医疗信息整合在一起,方便不同医疗机构之间的信息共享和互操作。这有助于提高医疗效率和协同治疗效果。

2、非结构化电子病历包含的信息复杂多样,其中不乏有不重要的信息和错误信息,这是无用信息的存在导致电子病历包含的信息冗余,这些冗余的信息存在使得医生在调取病历时,查看麻烦,降低医生的工作效率,同时不同医院对病历的要求不同、格式不同,不同科室的专业词汇不同,不同医生的表达习惯不同,这也都导致非结构化病历不同医生之间交互可能会存在理解上的误差,使得医生不能对患者有更好的诊断,因此,需要一种用于非结构化电子病历的数据清洗方法及系统,用于将非结构化电子病历中的关键信息进行提取,对一些非关键信息进行清除,使得电子病历便于不同医生理解,进而便于医生掌握病人的病情。


技术实现思路

1、本专利技术旨在至少解决现有技术中存在的技术问题之一;为此,本专利技术提出了一种用于非结构化电子病历的数据清洗方法及系统,用于解决现有技术中非结构化电子病历包含的信息复杂多样,对医生诊断查看历史病历时带来不便,可能导致误诊和迟诊的技术问题,本专利技术通过将病历文书的内容进行分类,并根据相应的分类进行数据清洗,对重要的信息进行补偿式的数据清洗,对于不重要的数据进行清除式的数据清洗解决了上述问题。

2、为实现上述目的,本专利技术的第一方面提供了一种用于非结构化电子病历的数据清洗系统,包括:

3、中枢处理模块,以及与其相连接的数据采集模块和储存模块;

4、数据采集模块:通过与之相连的医院平台获取病历文书,并将病历文书转化为文本信息,从文本信息中获得患者自述信息、医生诊断信息和检查检验信息、用药信息、治疗信息、手术与护理信息;

5、中枢处理模块:识别患者自述信息和医生诊断信息,并基于患者自述信息得到患者必要信息;基于筛选词对医生诊断信息进行筛选得到诊断必要信息;以及,

6、提取检查检验信息,并匹配其对应的检查图片;对检查检验信息及其对应的检查图片进行提取,生成检查数据;其中,检查数据包括检查项目、检查时间、检查地点和检查结果;以及,

7、对患者必要信息和诊断必要信息进行数据清洗补偿,得到重组信息一;所述重组信息一包括患者信息一和诊断信息一;以及,

8、对患者其他信息和诊断其他信息进行数据清洗,得到重组信息二;其中,患者其他信息为患者自述信息去除患者必要信息之后的信息;诊断其他信息为医生诊断信息去除诊断必要信息之后的信息;重组信息二包括患者信息二和诊断信息二;以及,

9、基于检查数据、重组信息一和重组信息二生成整合数据包并设置对应的标号;

10、储存模块:用于储存整合数据包和相应整合数据包对应的标号。

11、本专利技术通过将病历文书的内容进行分类,并根据相应的分类进行数据清洗,对重要的信息进行补偿式的数据清洗,对于不重要的数据进行清除式的数据清洗,使得重要的数据能够尽可能的得到完善和保留;同时,还将病历文书的内容进行了重新打包,将重要的信息放置数据包的前端,不重要的信息放置数据包的后端做辅助理解作用,便于不同医生快速获取并理解患者的病情。

12、优选的,所述基于患者自述信息得到患者必要信息,包括:

13、将本次患者自述信息拆分成若干个词,统计各个词在本次患者自述信息中出现的词频,得到词频最高的词,并将相应词对应的句段进行整合,生成患者必要信息。

14、本专利技术通过将患者描述中出现频率较高的词作为重要词,并对该词进行检索,将带有该词的句段进行提取整合,使得可以使用少量的信息表达出患者所要表达的关键点,便于医生对本次诊断的进行快速准确的理解。

15、优选的,所述基于筛选词对医生诊断信息进行筛选得到诊断必要信息,包括:

16、通过门诊病历获得本次门诊科室和病症,获取相应的科室和相应的病症输入到关键词提取模型,得到筛选词;所述关键词提取模型通过人工智能模型训练获得;

17、在医生诊断信息中查询相应的筛选词,以及相应筛选词对应的句段,并将相应的句段进行整合,生成诊断必要信息。

18、本专利技术通过使用人工智能模型对医生诊断进行筛选,便于快速获得医生诊断中的关键相关信息,进而在病历查询的过程中快速将病历中重要的关键的信息展示给相应的医生,节省查询时间。

19、优选的,所述关键词提取模型通过人工智能模型训练获得,包括:

20、对若干科室和相应科室内对应的病症,以及相应病症对应的医生诊断信息以及医生诊断信息中的关键词进行整合生成训练数据,并用相应训练数据对模型进行训练;

21、设置若干组科室和科室对应的病症作为实验数据,输入模型,得到相应科室对应病症的关键词;

22、对实验数据和其对应的输出结果进行评估,并将根据评估结果对模型进行相应的调整,由此得到关键词提取模型,并将关键词输出为筛选词;其中,人工智能模型包括bp神经网络模型或者rbf神经网络模型。

23、本专利技术通过根据科室的不同和病症的不同,设置对应的关键词,避免了对所有病历使用固定种类的关键词查询导致的重要信息缺失,同时本专利技术的关键词提取模型会实时更新,即本专利技术的筛选词库会更新,进一步保证了病历中的重要信息不被丢失。

24、优选的,所述对患者必要信息和诊断必要信息进行数据清洗补偿,得到重组信息一,包括:

25、检查患者必要信息和诊断必要信息中的字符是否存在缺失或错误;

26、是,则以缺失或错误字符最临近的字符为中心词,以缺失或错误的字符数量为背景窗口,并将相应的中心词和其对应的背景窗口输入到跳字模型,获得缺失或错误的字符对应的修改字符;

27、使用修改字符替换缺失或错误的字符;

28、对被替换缺失或错误的字符对应的句段进行检测,判断相应句段是否存在缺失或错误;

29、否,则根据相应的患者必要信息和诊断必要信息生成相应的重组信息一;其中。

30、本专利技术通过使用跳字模型对患者必要信息和诊断必要信息中缺失或错误的字符进行补偿修正,保证了患者必要信息和诊断必要信息的完整性,避免患者必要信息和诊断必要信息的数据丢失。

31、优选的,所述对患者自述信息中除患者必要信息外的患者其他信息和医生诊断信息除诊断必要信息外的诊断其他信息进行数据清洗,得到重组信息二,包括:

32、检查患者其他信息和诊断其他信息中的字符是否存在缺失、错误还有重复的字符;并则相应的缺失、错误还有重复的字符对应本文档来自技高网...

【技术保护点】

1.一种用于非结构化电子病历的数据清洗系统,其特征在于,包括:

2.根据权利要求1所述的一种用于非结构化电子病历的数据清洗系统,其特征在于,所述基于患者自述信息得到患者必要信息,包括:

3.根据权利要求1所述的一种用于非结构化电子病历的数据清洗系统,其特征在于,所述基于筛选词对医生诊断信息进行筛选得到诊断必要信息,包括:

4.根据权利要求3所述的一种用于非结构化电子病历的数据清洗系统,其特征在于,所述关键词提取模型通过人工智能模型训练获得,包括:

5.根据权利要求1所述的一种用于非结构化电子病历的数据清洗系统,其特征在于,所述对患者必要信息和诊断必要信息进行数据清洗补偿,得到重组信息一,包括:

6.根据权利要求1所述的一种用于非结构化电子病历的数据清洗系统,其特征在于,所述对患者自述信息中除患者必要信息外的患者其他信息和医生诊断信息除诊断必要信息外的诊断其他信息进行数据清洗,得到重组信息二,包括:

7.一种用于非结构化电子病历的数据清洗方法,基于权利要求1至6任意一项所述的一种用于非结构化电子病历的数据清洗系统,其特征在于,包括:

...

【技术特征摘要】

1.一种用于非结构化电子病历的数据清洗系统,其特征在于,包括:

2.根据权利要求1所述的一种用于非结构化电子病历的数据清洗系统,其特征在于,所述基于患者自述信息得到患者必要信息,包括:

3.根据权利要求1所述的一种用于非结构化电子病历的数据清洗系统,其特征在于,所述基于筛选词对医生诊断信息进行筛选得到诊断必要信息,包括:

4.根据权利要求3所述的一种用于非结构化电子病历的数据清洗系统,其特征在于,所述关键词提取模型通过人工智能模型训练获得,包括:

5.根据...

【专利技术属性】
技术研发人员:徐凌志
申请(专利权)人:安徽医尔康信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1