电子病历的构建方法及装置制造方法及图纸

技术编号:24891507 阅读:51 留言:0更新日期:2020-07-14 18:17
本申请实施例提供了一种电子病历的构建方法及装置,涉及人工智能领域。其中,所述方法包括:基于配置的语法规则,对用于构建电子病历样本的电子病历进行解析,以确定所述电子病历的结构化信息;基于所述电子病历的结构化信息,构建用于训练电子病历结构化模型的电子病历样本。通过本申请实施例,能够大量构建电子病历样本,以避免通过大量标注电子病历来获得用于训练电子病历结构化模型的电子病历样本的情况的发生,从而大大降低了电子病历结构化模型的训练成本。

【技术实现步骤摘要】
电子病历的构建方法及装置
本申请实施例涉及人工智能领域,尤其涉及一种电子病历的构建方法及装置。
技术介绍
电子病历系统的现代化是医疗信息化建设的关键之一,电子病历中包含的信息对于建立起追随病人一生的健康画像起着至关重要的作用。此外,电子病历也是从事医疗科研的重要的源数据。目前,市面上大量的电子病历因为历史原因,往往将诊断信息、医生查房信息等众多的文本信息直接存储为文本字段,舍弃了电子病历中应有的大量的结构化信息,不利于电子病历中包含的信息的标准化存储、分享以及分析。如果实现电子病历系统的全面结构化,又往往会给医生的电子病历输入带来额外的负担。因此,在现有技术中的操作模式上,医生仍然按照传统习惯,以无结构化或半结构化的方式输入电子病历,然后由电子病历系统对医生输入的电子病历进行完全的结构化。在现有技术中,电子病历系统可利用机器学习的方法对医生输入的电子病历进行完全的结构化。在对医生输入的电子病历进行结构化时,需要大量标注电子病历用于电子病历结构化模型的训练,从而导致电子病历结构化模型的训练的成本太高。
技术实现思路
本申请的目的在于提出一种电子病历的构建方法及装置,用于解决现有技术中存在的通过大量标注电子病历来获得用于训练电子病历结构化模型的电子病历样本而导致的电子病历结构化模型的训练成本高的问题。根据本申请实施例的第一方面,提供了一种电子病历的构建方法。所述方法包括:基于配置的语法规则,对用于构建电子病历样本的电子病历进行解析,以确定所述电子病历的结构化信息;基于所述电子病历的结构化信息,构建用于训练电子病历结构化模型的电子病历样本。根据本申请实施例的第二方面,提供了一种电子病历的构建装置。所述装置包括:解析模块,用于基于配置的语法规则,对用于构建电子病历样本的电子病历进行解析,以确定所述电子病历的结构化信息;构建模块,用于基于所述电子病历的结构化信息,构建用于训练电子病历结构化模型的电子病历样本。通过本申请实施例提供的技术方案,基于配置的语法规则,对用于构建电子病历样本的电子病历进行解析,以确定所述电子病历的结构化信息,并基于所述电子病历的结构化信息,构建用于训练电子病历结构化模型的电子病历样本,与现有的其它方式相比,能够大量构建电子病历样本,以避免通过大量标注电子病历来获得用于训练电子病历结构化模型的电子病历样本的情况的发生,从而大大降低了电子病历结构化模型的训练成本。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1为本申请实施例一中电子病历的构建方法的步骤流程图;图2为根据本申请实施例一提供的语法分析树的示意图;图3为根据本申请实施例一提供的电子病历的构建方法的示意图;图4为本申请实施例二中电子病历的结构化方法的步骤流程图;图5为根据本申请实施例二提供的结构化信息转换处理的示意图;图6为本申请实施例三中电子病历的构建装置的结构示意图;图7为本申请实施例四中电子病历的构建装置的结构示意图;图8为本申请实施例五中电子病历的结构化装置的结构示意图;图9为本申请实施例六中电子病历系统的结构示意图;图10为本申请实施例七中电子设备的结构示意图;图11为本申请实施例八中电子设备的硬件结构。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅配置为解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。参照图1,示出了本申请实施例一的电子病历的构建方法的步骤流程图。具体地,本实施例提供的电子病历的构建方法包括以下步骤:在步骤S101中,基于配置的语法规则,对用于构建电子病历样本的电子病历进行解析,以确定所述电子病历的结构化信息。在本申请实施例中,所述语法规则为用于解析所述电子病历的规则,所述语法规则可理解为类似LL(1)的生成文法,其中,“LL”表示左倾斜解析树。举例来说,所述电子病历的文本中具有患者的个人信息,并且个人信息包括姓名、年龄、家庭住址,那么其对应的语法规则可为个人信息->(个人信息_key个人信息_value)*其中个人信息_key又可以进一步个人信息_key->“姓名”|”年龄”|”家庭住址”。所述电子病历的结构化信息包括所述电子病历中的多个文本片段及所述多个文本片段分别对应的结构标签。举例来说,所述结构标签可为上述的个人信息、姓名、年龄、家庭住址等。可以理解的是,以上描述仅为示例性的,本申请实施例对此不做任何限定。在一些可选实施例中,基于配置的语法规则,对用于构建电子病历样本的电子病历进行解析,以确定所述电子病历的结构化信息之前,所述方法还包括:确定所述电子病历所属的电子病历模板;基于所述电子病历模板,为所述电子病历配置用于解析所述电子病历的语法规则。籍此,能够准确地为电子病历配置相应的结构化规则。可以理解的是,以上描述仅为示例性的,本申请实施例对此不做任何限定。在一个具体的例子中,不同的医院的电子病历模板不相同,即便是同一家医院的电子病历,它们所属的电子病历模板也不相同,例如,不同科室的病历,或者不同用途的病历。因此,在具体实施时,首先确定电子病历所属的电子病历模板的种类,然后基于每种电子病历模板,由经培训的专业人员撰写相应的语法规则,该语法规则应当完整覆盖电子病历模板,但同时应当有充足的灵活度。例如,在电子病历模板的结构标签包括姓名、年龄、家庭住址时,撰写的语法规则可不限制电子病历模板中姓名、年龄、家庭住址的顺序,从而体现语法规则的灵活度。在为每种电子病历模板撰写相应的语法规则之后,可确定用于构建电子病历样本的电子病历所属的电子病历模板。具体地,可根据电子病历的标识信息,确定电子病历所属的电子病历模板。例如,可通过扫描电子病历的二维码或条形码,确定电子病历所属的电子病历模板。在确定电子病历所属的电子病历模板之后,可确定所述电子病历模板对应的语法规则为用于解析所述电子病历的语法规则。可以理解的是,以上描述仅为示例性的,本申请实施例对此不做任何限定。在一些可选实施例中,在基于配置的语法规则,对用于构建电子病历样本的电子病历进行解析,以确定所述电子病历的结构化信息时,通过语法分析器生成工具,基于所述语法规则,生成用于分析所述电子病历的内容的语法分析器;通过所述语法分析器,对所述电子病历的内容进行分析,以确定所述电子病历对应的语法分析树;基于所述语法分析树,确定所述电子病历的结构化信息。籍此,能够准确地确定电子病历的结构化信息。可以理解的是,基于配置的语法规则,对用于构建电子病历样本的电子病历进行解析,以确定所述电子病历的结构化信息的任何实施方式均可适用于此,本申请实施例对此不做任何限定。在一个具本文档来自技高网...

【技术保护点】
1.一种电子病历的构建方法,其特征在于,所述方法包括:/n基于配置的语法规则,对用于构建电子病历样本的电子病历进行解析,以确定所述电子病历的结构化信息;/n基于所述电子病历的结构化信息,构建用于训练电子病历结构化模型的电子病历样本。/n

【技术特征摘要】
1.一种电子病历的构建方法,其特征在于,所述方法包括:
基于配置的语法规则,对用于构建电子病历样本的电子病历进行解析,以确定所述电子病历的结构化信息;
基于所述电子病历的结构化信息,构建用于训练电子病历结构化模型的电子病历样本。


2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定所述电子病历所属的电子病历模板;
基于所述电子病历模板,为所述电子病历配置用于解析所述电子病历的语法规则。


3.根据权利要求2所述的方法,其特征在于,所述基于配置的语法规则,对用于构建电子病历样本的电子病历进行解析,以确定所述电子病历的结构化信息,包括:
通过语法分析器生成工具,基于所述语法规则,生成用于分析所述电子病历的内容的语法分析器;
通过所述语法分析器,对所述电子病历的内容进行分析,以确定所述电子病历对应的语法分析树;
基于所述语法分析树,确定所述电子病历的结构化信息。


4.根据权利要求3所述的方法,其特征在于,所述结构化信息包括所述电子病历中的多个文本片段及所述多个文本片段分别对应的结构标签,
所述基于所述语法分析树,确定所述电子病历的结构化信息,包括:
对所述语法分析树中的每个中间节点的所有后代叶子节点的文本内容进行合并,获得相应的中间节点对应的文本片段,并确定所述中间节点为所述文本片段对应的结构标签。


5.根据权利要求1所述的方法,其特征在于,所述结构化信息包括所述电子病历中的多个文本片段及所述多个文本片段分别对应的结构标签,
所述基于所述电子病历的结构化信息,构建用于训练电子病历结构化模型的电子病历样本,包括:
遍历所述电子病历中的多个文本片段,如果基于第一概率事件,确定对所述电子病历中的文本片段执行删除操作时,删除所述文本片段及所述文本片段对应的结构标签,以生成所述电子病历样本。


6.根据权利要求1所述的方法,其特征在...

【专利技术属性】
技术研发人员:仇伟陈漠沙程钰淇李兆融李林琳司罗
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1