System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于电子病历数据的药品不良反应识别方法及设备技术_技高网

基于电子病历数据的药品不良反应识别方法及设备技术

技术编号:40610899 阅读:4 留言:0更新日期:2024-03-12 22:18
本申请涉及一种基于电子病历数据的药品不良反应识别方法及设备,方法包括:S1、构建预训练模型;S2、以包含目标不良反应名称为需求从电子病历样本数据中抽取部分数据进行标注;标注至少包括:医疗文本记录中包含的药品不良反应类别,以及药品不良反应类别对应的命名实体;S3、根据标注数据对预训练模型进行调优;S4、对调优后的预训练模型进行性能评估;S5、若性能评估结果未满足预设要求,则基于调优后的预训练模型对电子病历样本数据进行筛选;S6、以包含目标不良反应名称为需求从筛选后的电子病历样本数据中抽取部分数据进行标注;S7、重复执行步骤S3‑S6,直至性能评估结果满足预设要求,完成训练,得到识别模型;识别模型用于在输入电子病历数据时,输出药品不良反应识别结果。

【技术实现步骤摘要】

本申请涉及模型训练,尤其涉及一种基于电子病历数据的药品不良反应识别方法及设备


技术介绍

1、药物不良反应(adverse drug reactions,adr)是一种重要的临床与公共卫生问题。通过对电子病历数据的深度分析,可以发现药物使用的模式,以及药物与特定疾病或病症之间的关联。

2、现有技术中通过基于医院电子病历系统中的非结构化数据开展药品不良反应信号监测,常用方式包括规则算法或者疾病编码,即使采用深度学习算法,也需要面临以下问题:现实诊疗环境下,药物不良反应事件发生率较低,非专业或资历较浅的医务人员难以识别;需要处理大量的噪声信息,定义严苛容易导致漏诊;医生的诊疗水平参差不齐,同时疾病编码率准确性差,容易导致误诊与漏诊。


技术实现思路

1、为至少在一定程度上克服相关技术中药物不良反应事件发生率较低,识别药品不良反应准确性低的问题,本申请提供一种基于电子病历数据的药品不良反应识别方法及设备。

2、本申请的方案如下:

3、根据本申请实施例的第一方面,提供一种基于电子病历数据的药品不良反应识别方法,包括:

4、s1、构建预训练模型;

5、s2、以包含目标不良反应名称为需求从电子病历样本数据中抽取部分数据进行标注;所述标注至少包括:医疗文本记录中包含的药品不良反应类别,以及药品不良反应类别对应的命名实体;

6、s3、根据标注数据对所述预训练模型进行调优;

7、s4、对调优后的预训练模型进行性能评估;

8、s5、若性能评估结果未满足预设要求,则基于调优后的预训练模型对电子病历样本数据进行筛选;

9、s6、以包含目标不良反应名称为需求从筛选后的电子病历样本数据中抽取部分数据进行标注;

10、s7、重复执行步骤s3-s6,直至性能评估结果满足预设要求,完成训练,得到识别模型;所述识别模型用于在输入电子病历数据时,输出药品不良反应识别结果。

11、优选地,构建预训练模型,包括:

12、获取无标注文本数据;

13、使预训练模型利用无标注文本数据本身的结构或规律,生成标签或目标,实现半监督学习。

14、优选地,对抽取的电子病历样本数据进行标注前,所述方法还包括:

15、使用分词工具对抽取的电子病历样本数据中的医疗文本记录进行分词,并统计单字个数。

16、优选地,预训练模型进行调优的目标函数为:

17、其中,表示命名实体识别损失函数,表示诊断分类识别损失函数;n表示总的训练样本数;c表示总的命名实体类别数;c′表示总的诊断类别数;p表示命名实体标注的类别;表示命名实体预测的得分;q表示诊断标注的类别;表示诊断预测的得分;α表示权重系数。

18、优选地,性能评估结果的预设要求为模型预测精度满足预设值。

19、优选地,所述预训练模型为macbert模型、chinesebert模型或spanbert模型。

20、优选地,所述方法还包括:

21、根据电子病历样本数据的文本长度在macbert模型、chinesebert模型或spanbert模型中确定预训练模型。

22、根据本申请实施例的第二方面,提供一种基于电子病历数据的药品不良反应识别装置,包括:

23、处理器和存储器;

24、所述处理器与存储器通过通信总线相连接:

25、其中,所述处理器,用于调用并执行所述存储器中存储的程序;

26、所述存储器,用于存储程序,所述程序至少用于执行如以上任一项所述的一种基于电子病历数据的药品不良反应识别方法。

27、本申请提供的技术方案可以包括以下有益效果:本申请中的基于电子病历数据的药品不良反应识别方法,包括:s1、构建预训练模型;s2、以包含目标不良反应名称为需求从电子病历样本数据中抽取部分数据进行标注;所述标注至少包括:医疗文本记录中包含的药品不良反应类别,以及药品不良反应类别对应的命名实体;s3、根据标注数据对预训练模型进行调优;s4、对调优后的预训练模型进行性能评估;s5、若性能评估结果未满足预设要求,则基于调优后的预训练模型对电子病历样本数据进行筛选;s6、以包含目标不良反应名称为需求从筛选后的电子病历样本数据中抽取部分数据进行标注;s7、重复执行步骤s3-s6,直至性能评估结果满足预设要求,完成训练,得到识别模型;识别模型用于在输入电子病历数据时,输出药品不良反应识别结果。本申请中的技术方案利用预训练模型,可以提高对可能包含药品不良反应的医疗文本记录的发现能力,避免在进行数据标注时,较难获取阳性样本所导致的数据不平衡的问题,同时也减少了标注的工作量,节约了人力和时间的成本。本申请中首先基于规则标注少量样本数据,然后以此标注的样本数据对预训练模型进行调优,然后使用调优后的预训练模型对样本数据进行筛选,并使用筛选后的数据继续标注,此过程迭代进行,直到模型预测精度达到要求为止,如此得到的识别模型对电子病历数据的药品不良反应识别准确度更高。

28、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。

本文档来自技高网...

【技术保护点】

1.一种基于电子病历数据的药品不良反应识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,构建预训练模型,包括:

3.根据权利要求1所述的方法,其特征在于,对抽取的电子病历样本数据进行标注前,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,预训练模型进行调优的目标函数为:

5.根据权利要求1所述的方法,其特征在于,性能评估结果的预设要求为模型预测精度满足预设值。

6.根据权利要求1所述的方法,其特征在于,所述预训练模型为MacBert模型、ChineseBert模型或SpanBert模型。

7.根据权利要求6所述的方法,其特征在于,所述方法还包括:

8.一种基于电子病历数据的药品不良反应识别装置,其特征在于,包括:

【技术特征摘要】

1.一种基于电子病历数据的药品不良反应识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,构建预训练模型,包括:

3.根据权利要求1所述的方法,其特征在于,对抽取的电子病历样本数据进行标注前,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,预训练模型进行调优的目标函数为:

5.根据权利要求...

【专利技术属性】
技术研发人员:王雯孙鑫王鸣岐赵振杰李论
申请(专利权)人:四川大学华西医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1