System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及医疗资源管理领域,具体涉及一种基于神经网络的电子病历文本信息抽取方法,一种基于神经网络的电子病历文本信息抽取系统,一种数据生成方法,一种电子设备以及一种计算机存储介质。
技术介绍
1、电子病历(electronic medical record,emr)是医务人员对病人患病经过和治疗情况所作的文字、符号、图表、图形、数字、影像等数字化信息,是医生诊断和治疗疾病的依据。电子病历作为患者整个诊疗过程的原始记录,记载了病人住入医疗机构后由患者或陪同人陈述发病经过,而且也记录医师对病情的分析、诊断、治疗的过程,对预后的估计,以及各级医师查房和会诊的意见。
2、目前,结构化电子病历的采集方式病历文本中长期大量存在非结构化数据,如文本、图像、声音等,非结构化数据占比达较高,为计算机自动处理制造障碍。其次,各系统之间对数据编码和标准的使用不统一,数据录入有随意性,例如诊断编码、手术编码等的随意性,降低了数据的可操作性,影响了临床数据质量和信息的交换与共享。
3、对此,现有技术多是提供一种结构化模板的电子病历,医生可按照菜单栏对应填写相应的信息。但是上述结构化模板的电子病历需要医生更多的键鼠操作来完成病历填写,病历填写缺失灵活性与自由性;且结构化模板的电子病历结构较为固定,从而影响医生的书写习惯和思维,不利于完整地描述出医生对病历信息的描述,进而影响电子病历的准确度。
4、因此,如何使电子病历完整地描述出医生对病历信息的描述,提升现有电子病历的准确度,成为本领域技术人员亟待解决的问题。
/>技术实现思路
1、本申请实施例提供一种,以解决现有技术中如何使电子病历完整地描述出医生对病历信息的描述,提升现有电子病历的准确度的问题。
2、本申请实施例提供一种基于神经网络的电子病历文本信息抽取方法,包括:
3、获得录入的电子病历的文本数据;
4、将所述文本数据进行分类处理,获得具有类别标识的类别文本数据;
5、从所述类别文本数据中提取医学实体数据,并将所述医学实体数据组成医学描述数据;
6、基于所述医学描述数据并按照预设结构生成结构化病历数据;所述预设结构为符合自然语言语序的结构。
7、可选的,所述将所述文本数据进行分类处理,获得具有类别标识的类别文本数据,包括:
8、将所述文本数据转化为对应的第一向量数据;
9、获得预先生成的病历分类模型,将与所述文本数据对应的第一向量数据输入至所述病历分类模型,以获得类别特征和类别特征对应的类别概率数据;
10、从所述类别概率数据中筛选出概率值最大的目标类别概率数据对应的目标类别特征;
11、基于所述目标类别特征,输出具有类别标识的类别文本数据。
12、可选的,在所述文本数据进行分类处理,获得具有类别标识的类别文本数据之前,还包括:
13、确定所述文本数据是否具有类别标识;
14、若所述文本数据具有对应的类别标识,则为具有类别标识的所述文本数据选择对应类别的病历分类模型;
15、若所述文本数据不具有对应的类别标识,则从预设的候选病历分类模型为所述文本数据选择对应的病历分类模型。
16、可选的,所述预先生成的病历分类模型通过如下方式生成:
17、获得多个电子病历的文本数据和所述文本数据分别对应的类别标识;所述电子病历为用户根据自身书写习惯并结合医学表达格式录入的电子病历;
18、将所述文本数据和所述文本数据对应的类别标识分别对应转化为文本向量数据和类别向量数据;
19、将部分所述文本向量数据和其相对应的类别向量数据输入至初始病历分类模型进行多轮次的迭代训练,并获得每迭代轮次的所述初始病历分类模型的第一输出结果;
20、根据所述每迭代轮次的所述初始病历分类模型的第一输出结果对应调整所述初始病历分类模型,以获得目标病历分类模型;
21、将剩余部分所述文本向量数据和其相对应的类别向量数据输入至所述目标病历分类模型,以获得所述目标病历分类模型的第二输出结果;
22、将所述第二输出结果与预设结果匹配,若匹配值达到预设阈值,则将所述目标病历分类模型作为病历分类模型;若匹配值未达到预设阈值,则调整所述初始病历分类模型的模型参数,和/或调整所述多个电子病历的文本数据和所述文本数据分别对应的类别标识的数量,和/或将所述文本数据和所述文本数据对应的类别标识分别对应转化为新的文本向量数据和类别向量数据,并采用所述新的文本向量数据和类别向量数据对调整后的所述初始病历分类模型按照上述方式进行多轮次的迭代训练,直至确定出病历分类模型。
23、可选的,所述从所述类别文本数据中提取医学实体数据,包括:
24、将所述类别文本数据转化为对应的第二向量数据;
25、获得预先生成的实体识别模型,将与所述类别文本数据对应的第二向量数据输入至所述实体识别模型,以获得所述类别文本数据对应的第二向量的实体标签;
26、根据所述实体标签从所述类别文本数据中提取医学实体数据。
27、可选的,所述获得所述类别文本数据对应的第二向量的实体标签,包括:获得所述类别文本数据对应的第二向量中的每个文字的向量数据对应的实体标签。
28、可选的,所述类别文本数据对应的第二向量的实体标签至少包括患者实体标签、连接词实体标签、部位实体标签、药品名实体标签、表现实体标签以及时间实体标签。
29、可选的,所述预先生成的实体识别模型通过如下方式生成:
30、获得多个电子病历的文本数据和所述文本数据的医学实体数据;所述电子病历为用户根据自身书写习惯并结合医学表达格式录入的电子病历;
31、获得所述文本数据的医学实体数据对应的实体标签,并将所述文本数据的医学实体数据和其对应的实体标签分别转化为文本数据的医学实体数据向量数据和实体标签向量数据;
32、将部分所述文本数据的医学实体数据向量数据和其对应的实体标签向量数据输入至初始实体识别模型进行多轮次的迭代训练,并获得每迭代轮次的所述初始实体识别模型的第一输出结果;
33、根据所述每迭代轮次的所述初始实体识别模型的第一输出结果对应调整所述初始实体识别模型,以获得目标实体识别模型;
34、将剩余部分所述文本数据的医学实体数据向量数据和其对应的实体标签向量数据输入至所述目标实体识别模型,以获得所述目标实体识别模型的第二输出结果;
35、将所述第二输出结果与预设结果匹配,若匹配值达到预设阈值,则将所述目标实体识别模型作为实体识别模型;
36、若匹配值未达到预设阈值,则调整所述初始实体识别模型的模型参数,和/或调整所述多个医学实体数据和所述医学实体数据对应的实体标签的数量,和/或将所述文本数据的医学实体数据和其对应的实体标签分别转化为新的文本数据的医学实体数据向量数据和实体标签向量数据,本文档来自技高网...
【技术保护点】
1.一种基于神经网络的电子病历文本信息抽取方法,其特征在于,包括:
2.根据权利要求1所述的基于神经网络的电子病历文本信息抽取方法,其特征在于,所述将所述文本数据进行分类处理,获得具有类别标识的类别文本数据,包括:
3.根据权利要求2所述的基于神经网络的电子病历文本信息抽取方法,其特征在于,在所述文本数据进行分类处理,获得具有类别标识的类别文本数据之前,还包括:
4.根据权利要求2所述的基于神经网络的电子病历文本信息抽取方法,其特征在于,所述预先生成的病历分类模型通过如下方式生成:
5.根据权利要求1所述的基于神经网络的电子病历文本信息抽取方法,其特征在于,所述从所述类别文本数据中提取医学实体数据,包括:
6.根据权利要求5所述的基于神经网络的电子病历文本信息抽取方法,其特征在于,所述获得所述类别文本数据对应的第二向量的实体标签,包括:获得所述类别文本数据对应的第二向量中的每个文字的向量数据对应的实体标签。
7.一种基于神经网络的电子病历文本信息抽取系统,其特征在于,包括:
8.一种数据生成方法,
9.一种电子设备,其特征在于,所述电子设备包括:处理器;存储器,用于存储计算机程序,该计算机程序被处理器运行,执行权利要求1-7、8任意一项所述的方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序,该计算机程序被处理器运行,执行权利要求1-7、8任意一项所述的方法。
...【技术特征摘要】
1.一种基于神经网络的电子病历文本信息抽取方法,其特征在于,包括:
2.根据权利要求1所述的基于神经网络的电子病历文本信息抽取方法,其特征在于,所述将所述文本数据进行分类处理,获得具有类别标识的类别文本数据,包括:
3.根据权利要求2所述的基于神经网络的电子病历文本信息抽取方法,其特征在于,在所述文本数据进行分类处理,获得具有类别标识的类别文本数据之前,还包括:
4.根据权利要求2所述的基于神经网络的电子病历文本信息抽取方法,其特征在于,所述预先生成的病历分类模型通过如下方式生成:
5.根据权利要求1所述的基于神经网络的电子病历文本信息抽取方法,其特征在于,所述从所述类别文本数据中提取医学实体数据,包括:
...【专利技术属性】
技术研发人员:韩士斌,苏明亮,李言生,邓毅,江大鹏,刘克佳,侯鹏鹏,杨巍,程恋,龚后武,
申请(专利权)人:东华医为科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。