电子病历处理的方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:17705202 阅读:29 留言:0更新日期:2018-04-14 18:05
一种电子病历处理的方法、装置、计算机设备及计算机存储介质,首先获取电子病历字符文本,根据预设关键词对获取的所述电子病历字符文本进行文本块划分,得到多个文本块,对每个文本块中进行字段识别和信息提取,得到每个文本块中的字段和对应的信息内容,对所述每个文本块中的字段和对应的信息内容进行合并,生成半结构化电子病历。上述方法可以将医院内以word、txt等文件形式存储的电子病历半结构化,从而使得电子病历有规律的存放,方便后续分析和使用。

【技术实现步骤摘要】
电子病历处理的方法、装置、计算机设备及存储介质
本专利技术涉及信息
,特别是涉及一种电子病历处理的方法、装置、计算机设备及计算机存储介质。
技术介绍
电子病历是患者在医疗机构就诊时产生的医疗记录,主要有基本信息、病史(包括主诉、现病史、既往史等信息)、病程记录、阶段小结、出院记录、会诊记录等多种医疗数据信息。在医院未进行信息化建设之前以及信息化建设的早期阶段,医院将电子病历的所有内容存储在一个文件中,这样的存储方式不便于电子病历的后续分析与应用。近年来,信息化较好的医院通过使用HIS等信息化系统,从输入端进行控制,对新的电子病历按照内容进行半结构化存储,可以方便地得到病人的诊疗时间线及诊疗活动经过。但是,无论是信息化建设较为完善的医院还是信息化建设不完善的医院,医院内部仍有大量以word、txt等文件形式存储的未经半结构化的电子病历,而这些未经半结构化的电子病历数据难以与当前HIS等信息化系统对接或直接再次利用。因此,如何将医院内大量以word、txt等文件形式存储的电子病历进行半结构化处理,成为亟待解决的问题。
技术实现思路
基于传统技术无法将大量以word、txt等文件形式存储的电子病历半结构化的问题,本专利技术的目的在于提供一种半结构化数据的方法、装置、计算机设备及计算机存储介质。一种电子病历处理的方法,所述方法包括如下步骤:获取电子病历字符文本;根据预设关键词对获取的所述电子病历字符文本进行文本块划分,得到多个文本块;对每个文本块中进行字段识别和信息提取,得到每个文本块中的字段和对应的信息内容;对所述每个文本块中的字段和对应的信息内容进行合并,生成半结构化电子病历。在其中一个实施例中,获取电子病历字符文本的步骤包括:获取电子病历;对所述电子病历进行字符转换,生成所述电子病历字符文本。在其中一个实施例中,所述根据预设关键词对获取的所述电子病历字符文本进行文本块划分,得到多个文本块,包括:从所述电子病历字符文本的首行开始进行逐行搜索,当搜索到预设关键词时,将预设关键词所在的行作为划分行,根据所述划分行将所述电子病历字符文本划分为多个文本块。在其中一个实施例中,所述根据预设关键词对获取的所述电子病历字符文本进行文本块划分,得到多个文本块,包括:从所述电子病历字符文本的首行开始进行逐行搜索,当搜索到预设关键词时,将预设关键词所在的行作为第一划分行,继续进行逐行搜索,当搜索到日期数据时,将日期数据所在的行作为第二划分行,根据所述第一划分行和第二划分行将所述电子病历字符文本划分为基本信息文本块、病史信息文本块和病程记录文本块。在其中一个实施例中,所述对每个文本块中进行字段识别和信息提取,得到每个文本块中的字段和对应的信息内容的步骤包括:根据预设的字符组合对每个文本块中信息进行识别及提取。在其中一个实施例中,所述对每个文本块中进行字段识别和信息提取,得到每个文本块中的字段和对应的信息内容的步骤还包括:若预设关键词在电子病历字符文本的预设位置,对预设关键词进行识别及提取。在其中一个实施例中,在所述获取电子病历字符文本的步骤之后,还包括:对所述电子病历字符文本中进行关键词匹配,得到所述电子病历字符文本中的自由信息字段和对应的信息内容;所述对每个文本块中的字段和对应的信息内容进行合并,生成半结构化电子病历,包括:将每个所述文本块中的字段和对应的信息内容以及所述自由信息字段和对应的信息内容进行合并,生成半结构化电子病历。一种电子病历处理装置,包括:划分模块,用于获取电子病历字符文本,根据预设关键词对获取的所述电子病历字符文本进行文本块划分,得到多个文本块;提取模块,用于对每个文本块中进行字段识别和信息提取,得到每个文本块中的字段和对应的信息内容;生成模块,用于对所述每个文本块中的字段和对应的信息内容进行合并,生成半结构化电子病历。一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现电子病历处理的方法的步骤。一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现电子病历处理的方法的步骤。上述电子病历处理的方法、装置、计算机设备及计算机存储介质,首先获取电子病历字符文本,根据预设关键词对获取的所述电子病历字符文本进行文本块划分,得到多个文本块,对每个文本块中进行字段识别和信息提取,得到每个文本块中的字段和对应的信息内容,对所述每个文本块中的字段和对应的信息内容进行合并,生成半结构化电子病历。上述方法、装置、计算机设备及计算机存储介质可以将医院内以word、txt等文件形式存储的电子病历半结构化,从而使得电子病历有规律的存放,方便后续分析和使用。附图说明图1为一实施例的电子病历处理的方法的流程图;图2为一实施例的得到属性相同电子病历字符文本流程图;图3为一实施例的电子病历处理装置的流程图。具体实施方式为了使本专利技术的技术方案更加清楚,以下结合附图,对本专利技术的技术方案进一步详细地说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术并不用于限定本专利技术。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。图1所示出的是其中一个具体实施例提供的一种半结构化数据的方法的流程图。该方法包括如下步骤:步骤S101,获取电子病历字符文本。电子病历字符文本为病历中与患者医疗相关的文本,用以描述患者的基本信息以及诊断结果等。获取的电子病历字符文本可以是占据各字节大小相等,也就是说,在存储空间占据相同字节存储量的文本信息。步骤S102,根据预设关键词对获取的所述电子病历字符文本进行文本块划分,得到多个文本块。当获取占据各字节大小相等的电子病历字符文本后,对相同字节的电子病历字符文本进行信息类别的划分,根据信息的不同类别划分,形成不同类别的模块。具体的,电子病历字符文本可以划分为基本信息、病史、病程记录、自由信息等电子病历模块。基本信息是患者的基本身份资料,包括:性别、年龄、职业等信息;病史是患者的患病过程以及过往患病经历,包括:现病史、既往史、家族史等信息;病程记录是整个治疗过程的详细记录,包括:查房记录、手术记录、阶段小结等信息;自由信息是电子病历中不固定表述位置的文本内容,包括:检查报告、出院诊断、目前诊断等信息。通过对不同类型的电子病历字符文本进行分类,可以获得至少一种信息类别,例如患者基本信息、病史、病程记录。步骤S103,对每个文本块中进行字段识别和信息提取,得到每个文本块中的字段和对应的信息内容。字段识别过程中,运用到了字段库,字段库包括与医疗相关的预设字段,用于检索电子病历字符文本是否包含预设字段。电子病历的字段是通过电子病历字符文本与字段库匹配后,检索出具有相同字段的结果内容。进行字段识别时,将每一电子病历模块对应的文本内容,在字段库中进行字段匹配,得到多个电子病历字段。将获取的相同字段类型的电子病历字符文本单独划分到同一数据库中。对文本块中进行信息提取是指,提取每一电子病历字段中的医疗关键信息。医疗关键信息是对电子病历字符文本进行模块分类后,根据信息类别预设所需关键信息,在每一字段类别中分别检索得到所需的关键信息。具体的,在病历基本信息中可以是检索与人口学信息相关联的病历信息,在病史中可以是检索过往患病情况本文档来自技高网...
电子病历处理的方法、装置、计算机设备及存储介质

【技术保护点】
一种电子病历处理的方法,其特征在于,所述方法包括如下步骤:获取电子病历字符文本;根据预设关键词对获取的所述电子病历字符文本进行文本块划分,得到多个文本块;对每个文本块中进行字段识别和信息提取,得到每个文本块中的字段和对应的信息内容;对所述每个文本块中的字段和对应的信息内容进行合并,生成半结构化电子病历。

【技术特征摘要】
2017.09.30 CN 20171094011521.一种电子病历处理的方法,其特征在于,所述方法包括如下步骤:获取电子病历字符文本;根据预设关键词对获取的所述电子病历字符文本进行文本块划分,得到多个文本块;对每个文本块中进行字段识别和信息提取,得到每个文本块中的字段和对应的信息内容;对所述每个文本块中的字段和对应的信息内容进行合并,生成半结构化电子病历。2.根据权利要求1所述的方法,其特征在于,所述获取电子病历字符文本的步骤包括:获取电子病历;对所述电子病历进行字符转换,生成所述电子病历字符文本。3.根据权利要求1所述的方法,其特征在于,所述根据预设关键词对获取的所述电子病历字符文本进行文本块划分,得到多个文本块,包括:从所述电子病历字符文本的首行开始进行逐行搜索,当搜索到预设关键词时,将预设关键词所在的行作为划分行,根据所述划分行将所述电子病历字符文本划分为多个文本块。4.根据权利要求1所述的方法,其特征在于,所述根据预设关键词对获取的所述电子病历字符文本进行文本块划分,得到多个文本块,包括:从所述电子病历字符文本的首行开始进行逐行搜索,当搜索到预设关键词时,将预设关键词所在的行作为第一划分行,继续进行逐行搜索,当搜索到日期数据时,将日期数据所在的行作为第二划分行,根据所述第一划分行和第二划分行将所述电子病历字符文本划分为基本信息文本块、病史信息文本块和病程记录文本块。5.根据权利要求4所述的方法,其特征在于,所述对每个文本块中进行字段识别和信息提取,得到每个...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:北京颐圣智能科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1