基于电子病历数据生成健康教育数据的方法和系统技术方案

技术编号:33289465 阅读:18 留言:0更新日期:2022-05-01 00:05
本发明专利技术涉及一种基于电子病历数据生成健康教育数据的方法和系统,该方法包括:获取第一患者数据;将第一患者数据输入预设疾病诊断模型,得到第一患者数据对应的疾病类型;根据第一患者数据对应的疾病类型在预设健康宣教知识库中确定出目标疾病类型;根据目标疾病类型,以及预设疾病类型与健康教育数据之间的对应关系,在预设健康宣教知识库中确定出目标健康教育数据;将目标健康教育数据发送给预设终端设备,以使用户获知目标健康教育数据的内容。本发明专利技术能够根据患者症状数据确定出目标健康教育数据,使得本申请能够给患者提供科学和精准的健康指导,以及给医生提供健康宣教指导,使得医生在诊疗过程中快速、准确和标准地开展健康宣教。开展健康宣教。开展健康宣教。

【技术实现步骤摘要】
基于电子病历数据生成健康教育数据的方法和系统


[0001]本专利技术涉及电子病历数据挖掘
,具体涉及一种基于电子病历数据生成健康教育数据的方法和系统。

技术介绍

[0002]目前,患者在就诊时,医生一般采用口头形式对患者进行健康宣教。健康宣教的内容为医生针对患者疾病的特点以医嘱的形式把防治患者疾病相关的医学行为指导落实到非药物处方的健康教育内容。健康宣教可帮助患者建立健康的生活方式,有效提高患者的自我健康管理能力,对临床治疗起到良好的辅助作用。
[0003]然而,由于一般情况下,患者数量众多,医生资源有限,这使得医生需要快速的完成单个患者的看诊任务,进而医生口头宣教的时间和内容有限,使得患者不能获取到高质量的健康宣教知识,不利于患者了解自身疾病,以及对自身疾病的治疗。

技术实现思路

[0004]有鉴于此,提供一种基于电子病历数据生成健康教育数据的方法和系统,以解决相关技术存在的使得患者不能获取到高质量的健康宣教知识的问题。
[0005]本专利技术采用如下技术方案:
[0006]第一方面,本专利技术提供了一种基于电子病历数据生成健康教育数据的方法,包括:
[0007]获取第一患者数据;所述第一患者数据包括患者症状数据;
[0008]将所述第一患者数据输入预设疾病诊断模型,得到所述第一患者数据对应的疾病类型;
[0009]根据所述第一患者数据对应的疾病类型在预设健康宣教知识库中确定出目标疾病类型;
[0010]根据所述目标疾病类型,以及预设疾病类型与健康教育数据之间的对应关系,在所述预设健康宣教知识库中确定出目标健康教育数据;
[0011]将所述目标健康教育数据发送给预设终端设备,以使用户根据所述预设终端设备显示的信息获知所述目标健康教育数据的内容。
[0012]优选的,所述预设疾病诊断模型的训练过程如下:
[0013]通过电子病历数据库获取第一样本数据;所述第一样本数据由多组第二患者数据组成,每组所述第二患者数据包括患者症状数据和疾病类型;
[0014]将所述第一样本数据划分为训练数据集和测试数据集;
[0015]采用所述训练数据集训练多个预设预训练语言模型;
[0016]采用所述测试数据集测试训练后的各所述预设预训练语言模型,得到测试结果;
[0017]根据所述测试结果在训练后的各所述预设预训练语言模型中确定出目标预设预训练语言模型,并将所述目标预设预训练语言模型定义为所述预设疾病诊断模型。
[0018]优选的,采用所述训练数据集训练预设预训练语言模型的方法如下:
[0019]步骤一、清洗所述训练数据集,以抽取所述训练数据集中的患者症状描述文本,以及删除所述训练数据集中的缺失数据和重复数据;
[0020]步骤二、加载所述预设预训练语言模型;
[0021]步骤三、设置所述预设预训练语言模型的训练超参数;所述训练超参数包括epochs;
[0022]步骤四、判断当前epoch计数是否小于预设训练次数,得到第一预设结果;当所述第一预设结果为是时,执行步骤五;当所述第一预设结果为否时,执行步骤十二;
[0023]步骤五、判断所述训练数据集中是否包含有未加载的第一样本数据,得到第二预设结果;当所述第二预设结果为是时,执行步骤六;当所述第二预设结果为否时,执行步骤十一;
[0024]步骤六、在所述训练数据集的未加载的第一样本数据中确定目标第一样本数据,并将所述目标第一样本数据输入所述预设预训练语言模型;
[0025]步骤七、通过所述预设预训练语言模型得到所述目标第一样本数据在各个疾病预测类别上的概率分布数据;
[0026]步骤八、根据所述概率分布数据确定出概率最大的疾病预测类别,并将所述概率最大的疾病预测类别作为目标疾病类别;
[0027]步骤九、根据所述目标疾病类别与所述目标第一样本数据对应的实际疾病类别确定所述预设预训练语言模型的损失数据,并根据所述损失数据调整所述预设预训练语言模型的训练参数;
[0028]步骤十、根据所述所述损失数据更新所述训练超参数,并执行步骤五;
[0029]步骤十一、增加epoch计数,并执行步骤四;
[0030]步骤十二、保存训练后的所述预设预训练语言模型。
[0031]优选的,所述通过所述预设预训练语言模型得到所述目标第一样本数据在各个疾病预测类别上的概率分布数据,包括:
[0032]将所述目标第一样本数据输入所述预设预训练语言模型的输入层,得到所述目标第一样本数据的向量表示;
[0033]将所述目标第一样本数据的向量表示输入所述预设预训练语言模型的transformer encoder,得到所述目标第一样本数据的语义表示;
[0034]将所述目标第一样本数据的语义表示输入所述预设预训练语言模型的输入softmax分类层,得到所述目标第一样本数据在各个疾病预测类别上的概率分布数据。
[0035]优选的,所述测试结果包括预测结果准确率;
[0036]所述根据所述测试结果在训练后的各所述预设预训练语言模型中确定出目标预设预训练语言模型,包括:
[0037]在训练后的各所述预设预训练语言模型中确定出预测结果准确率最高的预设预训练语言模型,并将所述预测结果准确率最高的预设预训练语言模型定义为所述目标预设预训练语言模型。
[0038]优选的,所述预设健康宣教知识库的构建方法如下:
[0039]通过电子病历数据库获取第二样本数据;
[0040]将所述第二样本数据输入所述预设疾病诊断模型的句向量生成接口,并通过所述
句向量生成接口将所述第二样本数据中的文本数据转换为语义向量;
[0041]将所述语义向量存储至预设向量存储引擎,以构建语义索引;
[0042]通过所述预设向量存储引擎生成索引ID,并建立所述索引ID与所述第二样本数据的对应关系;
[0043]将所述索引ID、所述第二样本数据、以及所述索引ID与所述第二样本数据的对应关系存入预设搜索引擎,以构建语义索引与电子病历元数据二级索引;
[0044]基于所述预设向量存储引擎和所述预设搜索引擎的查询服务模块,封装得到基于电子病历文本的健康教育数据语义检索服务模块,并将所述基于电子病历文本的健康教育数据语义检索服务模块定义为所述预设健康宣教知识库。
[0045]优选的,所述第二样本数据包括脱敏电子病历文本、ICD10编码、健康教育数据和调查问卷。
[0046]优选的,所述预设向量存储引擎为Milvus;
[0047]所述预设搜索引擎为ElasticSearch。
[0048]优选的,所述目标健康教育数据包括健康教育处方、健康教育视频和/或健康教育图片。
[0049]第二方面,本专利技术还提供了一种基于电子病历数据生成健康教育数据的系统,包括:
[0050]数据获取模块,用于获取第一患者数据;所述第一患者数据包括本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于电子病历数据生成健康教育数据的方法,其特征在于,包括:获取第一患者数据;所述第一患者数据包括患者症状数据;将所述第一患者数据输入预设疾病诊断模型,得到所述第一患者数据对应的疾病类型;根据所述第一患者数据对应的疾病类型在预设健康宣教知识库中确定出目标疾病类型;根据所述目标疾病类型,以及预设疾病类型与健康教育数据之间的对应关系,在所述预设健康宣教知识库中确定出目标健康教育数据;将所述目标健康教育数据发送给预设终端设备,以使用户根据所述预设终端设备显示的信息获知所述目标健康教育数据的内容。2.根据权利要求1所述的基于电子病历数据生成健康教育数据的方法,其特征在于,所述预设疾病诊断模型的训练过程如下:通过电子病历数据库获取第一样本数据;所述第一样本数据由多组第二患者数据组成,每组所述第二患者数据包括患者症状数据和疾病类型;将所述第一样本数据划分为训练数据集和测试数据集;采用所述训练数据集训练多个预设预训练语言模型;采用所述测试数据集测试训练后的各所述预设预训练语言模型,得到测试结果;根据所述测试结果在训练后的各所述预设预训练语言模型中确定出目标预设预训练语言模型,并将所述目标预设预训练语言模型定义为所述预设疾病诊断模型。3.根据权利要求2所述的基于电子病历数据生成健康教育数据的方法,其特征在于,采用所述训练数据集训练预设预训练语言模型的方法如下:步骤一、清洗所述训练数据集,以抽取所述训练数据集中的患者症状描述文本,以及删除所述训练数据集中的缺失数据和重复数据;步骤二、加载所述预设预训练语言模型;步骤三、设置所述预设预训练语言模型的训练超参数;所述训练超参数包括epochs;步骤四、判断当前epoch计数是否小于预设训练次数,得到第一预设结果;当所述第一预设结果为是时,执行步骤五;当所述第一预设结果为否时,执行步骤十二;步骤五、判断所述训练数据集中是否包含有未加载的第一样本数据,得到第二预设结果;当所述第二预设结果为是时,执行步骤六;当所述第二预设结果为否时,执行步骤十一;步骤六、在所述训练数据集的未加载的第一样本数据中确定目标第一样本数据,并将所述目标第一样本数据输入所述预设预训练语言模型;步骤七、通过所述预设预训练语言模型得到所述目标第一样本数据在各个疾病预测类别上的概率分布数据;步骤八、根据所述概率分布数据确定出概率最大的疾病预测类别,并将所述概率最大的疾病预测类别作为目标疾病类别;步骤九、根据所述目标疾病类别与所述目标第一样本数据对应的实际疾病类别确定所述预设预训练语言模型的损失数据,并根据所述损失数据调整所述预设预训练语言模型的训练参数;步骤十、根据所述所述损失数据更新所述训练超参数,并执行步骤五;
步骤十一、增加epoch计数,并执行步骤四;步骤十二、保存训练后的所述预设预训练语言模型。4.根据权利要求3所述的基于电子病历数据生成健康教育数据的方法,其特征在于,所述通过所述预设预训练语言模型得到所述目标第一样本数据在各个疾病预测类别上的概率分布数据,包括:将所述目标第一样本...

【专利技术属性】
技术研发人员:鲜湛贺昕曾柏霖张海滨
申请(专利权)人:深圳万海思数字医疗有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1