一种基于多模态增强的电子病历症状特征提取方法及系统技术方案

技术编号:43333766 阅读:23 留言:0更新日期:2024-11-15 20:30
本发明专利技术公开了一种基于多模态增强的电子病历症状特征提取方法及系统,方法包括:对电子病历中与目标疾病密切相关的症状特征进行标注,得到标注数据;构建症状特征预识别模型,并基于标注数据对该构建得到的症状特征预识别模型进行训练;对训练好的症状特征预识别模型进行微调,并利用该微调后的症状特征预识别模型进行症状特征识别,得到症状特征预识别结果收集多模态特征数据;将收集得到的多模态特征数据与症状特征预识别结果结合,利用基于多模态增强的NLP方法,提取得到症状特征识别结果。本发明专利技术可大大提高电子病历症状特征提取的准确度。

【技术实现步骤摘要】

本专利技术涉及实体命名识别的,尤其涉及到一种基于多模态增强的电子病历症状特征提取方法及系统


技术介绍

1、命名实体识别是指从复杂的结构化、非结构化和半结构化数据中抽取特定类型实体的识别任务,为文本结构化、关系抽取、文本摘要和机器翻译等自然语言处理任务提供基础支持,是自然语言处理的热点问题。采用命名实体识别技术,可以高效地获取医疗实体、结构化病历,为医疗知识图谱,健康智能问答、智能辅助诊疗、知识订阅等服务提供支持,推动智慧医疗发展。

2、在医疗领域,电子病历(electronic medical records,emrs)作为重要的信息资源,蕴涵大量医学专业知识,然而,由于电子病历中的信息量巨大且格式复杂,且大部分以非结构化数据形式存在,医生很难在短时间内找到关键信息,从而影响药物性肝损伤的诊断和治疗效果。近年来,自然语言处理技术在医疗领域取得了显著的进展,如命名实体识别(named entity recognition,ner)、关系抽取等任务。其中,命名实体识别旨在从非结构化文本中识别出具有特定意义的实体并分类,在多种自然语言处理任务中发挥本文档来自技高网...

【技术保护点】

1.一种基于多模态增强的电子病历症状特征提取方法,其特征在于,包括:

2.根据权利要求1所述的一种基于多模态增强的电子病历症状特征提取方法,其特征在于,对电子病历中与目标疾病密切相关的症状特征进行标注,包括:

3.根据权利要求1所述的一种基于多模态增强的电子病历症状特征提取方法,其特征在于,构建的症状特征预识别模型包括BERT输入层、BILSTM序列建模层、CRF解码层;

4.根据权利要求3所述的一种基于多模态增强的电子病历症状特征提取方法,其特征在于,BERT输入层通过设计Masked Language Model和Next SentencePred...

【技术特征摘要】

1.一种基于多模态增强的电子病历症状特征提取方法,其特征在于,包括:

2.根据权利要求1所述的一种基于多模态增强的电子病历症状特征提取方法,其特征在于,对电子病历中与目标疾病密切相关的症状特征进行标注,包括:

3.根据权利要求1所述的一种基于多模态增强的电子病历症状特征提取方法,其特征在于,构建的症状特征预识别模型包括bert输入层、bilstm序列建模层、crf解码层;

4.根据权利要求3所述的一种基于多模态增强的电子病历症状特征提取方法,其特征在于,bert输入层通过设计masked language model和next sentenceprediction来训练症状特征预识别模型;

5.根据权利要求1所述的一种基于多模态增强的电子病历症状特征提取方法,其特征在于,对训练好的症状特征预识别模型进行微调时,利用训练好的症状特征预识别模型对标注...

【专利技术属性】
技术研发人员:赖信君霍玮炫陈文戈吴菊华
申请(专利权)人:广东工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1