【技术实现步骤摘要】
基于电子病历的患者画像生成方法、装置及存储介质
[0001]本专利技术涉及医疗数据信息处理领域,尤其是涉及一种基于电子病历的患者画像生成方法
、
装置及存储介质
。
技术介绍
[0002]随着医疗信息化建设的不断深入,电子病历系统中积累了大量电子病历记录,这些病历文本记录描述着患者的全周期诊疗信息
。
对电子病历文本内容进行细粒度解析,提取其中的关键信息,构建患者画像来对患者诊疗信息进行结构化与立体化的表示,在临床及科研上可为患者的诊疗提供直观展示和参考
。
[0003]中国专利
CN 110033837 A
公开了基于电子病历生成患者画像和知识图谱的方法,其首先基于
xml
文件内容,读取病历中字段名称与其对应的
ID
,然后识别字段中初步诊断
、
实验室检查
、
特殊检查特殊结构,解析病历中短文本,将提取的标签分类作为患者画像的标签,利用解析结果生成知识图谱
。
其所生成 ...
【技术保护点】
【技术特征摘要】
1.
一种基于电子病历的患者画像生成方法,其特征在于,包括:采集原始电子病历数据,并对采集的原始电子病历数据进行预处理,得到患者各业务场景下长文本形式的电子病历数据;针对不同业务场景下不同类型的长文本形式的电子病历数据,确定深层结构化结果,其中,所述深层结构化结果为需要抽取的实体或信息组,深层结构化结果中的实体为医学术语,信息组由存在修饰关系的多个实体组成;基于提取的病历数据以及其对应的信息组构建训练集,对信息抽取模型进行训练;基于训练好的信息抽取模型,输入病历文本数据,得到对应于该文本的深层结构化结果;获取目标患者的各业务场景下的各类型文本对应的深层结构化结果,并根据时间顺序进行整合得到患者画像
。2.
根据权利要求1所述的一种基于电子病历的患者画像生成方法,其特征在于,所述业务场景至少包括:门诊记录
、
入院记录
、
出院记录
、
病理结论
、
病程记录
、
医师查房记录
、
手术记录
、
死亡记录
、
影像结论和
24
小时出入院记录
。3.
根据权利要求1所述的一种基于电子病历的患者画像生成方法,其特征在于,所述医学术语基于术语集选择得到
。4.
根据权利要求1所述的一种基于电子病历的患者画像生成方法,其特征在于,所述实体类型至少包括方位
、
部位
、
细致部位
、
病变
、
大小状态
、
疾病
、
疾病性质
、
可见描述
、
疑似诊断
、
基因检测方法
、
检查结果
、
有无转移
、
时间
、
科室
、
检查检验项目
、
药物
、
症状
、
手术名称
、
分期
、
分级
、
形态
、
数量
、
侵犯情况
。5.
根据权利要求1所述的一种基于电子病历的患者画像生成方法,其特征在于,所述信息抽取模型的训练过程包括预训练过程和微调过程,其中,所述微调过程中,基于训练集数据和经由预训练过程的信息抽取模型,采用交叉熵损失对信息抽取模型进行微调
。6.
根据权利要求5所述的一种基于电子病历的患者画像生成方法,其特征在于,所述交叉熵损失具体为:,其中:
L
FT
为
Fine
‑
tuning...
【专利技术属性】
技术研发人员:李劲松,汪洋,史黎鑫,周天舒,田雨,
申请(专利权)人:之江实验室,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。