病历信息处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:34178477 阅读:52 留言:0更新日期:2022-07-17 12:30
本申请提供了一种病历信息处理方法、装置、电子设备及存储介质,该方法包括:获取目标病历信息;提取所述目标病历信息中的目标症状特征;确定所述目标症状特征与每个预设参照人群具有的预设症状特征之间的相似度,所述预设参照人群为具有同类疾病类型的人群;基于每个所述相似度以及第一预设相似度条件,在所有所述预设参照人群中搜索与所述目标症状特征匹配的目标参照人群;根据所述目标参照人群对应的疾病类型,确定诊断结果。本申请实施例能够提高疾病预测的速度。提高疾病预测的速度。提高疾病预测的速度。

Medical record information processing method, device, electronic equipment and storage medium

【技术实现步骤摘要】
病历信息处理方法、装置、电子设备及存储介质


[0001]本申请涉及数字医疗领域,具体涉及一种病历信息处理方法、装置、电子设备及存储介质。

技术介绍

[0002]随着数字化疾病预测技术的发展,常规的疾病预测建模方法是收集患者信息、病历以及诊断结果,构建多分类模型。其中,在疾病种类较多的情况下,参数量较大且不断增长,进行疾病预测时,所耗费的性能较大,多分类模型并行预测导致预测速度慢,无法及时响应快速实现疾病预测的需求。

技术实现思路

[0003]本申请的一个目的在于提出一种病历信息处理方法、装置、电子设备及存储介质,旨在解决疾病预测的速度慢的技术问题。
[0004]根据本申请实施例的一方面,公开了一种病历信息处理方法,所述方法包括:
[0005]获取目标病历信息;
[0006]提取所述目标病历信息中的目标症状特征;
[0007]确定所述目标症状特征与每个预设参照人群具有的预设症状特征之间的相似度,所述预设参照人群为具有同类疾病类型的人群;
[0008]基于每个所述相似度以及第一预设相似度条件,在所有所述预设参照人群中搜索与所述目标症状特征匹配的目标参照人群;
[0009]根据所述目标参照人群对应的疾病类型,确定诊断结果。
[0010]作为一种可选的实施方式,在本申请实施例第一方面中,所述方法还包括:
[0011]获取每种所述疾病类型对应的每种诊断类型的症状信息,所述诊断类型包括问诊、望诊、闻诊以及切诊,所述疾病类型包括疾病证型;
[0012]分别根据每种所述疾病类型对应的每种所述诊断类型的症状信息,构建每种所述疾病类型对应的每种所述诊断类型的症状特征集合;
[0013]分别对每种所述疾病类型对应的每种所述诊断类型的症状特征集合进行组合,得到每种所述疾病类型对应的参照体集合,所述参照体集合包括与所述疾病类型对应的所述预设症状特征。
[0014]作为一种可选的实施方式,在本申请实施例第一方面中,所述获取每种所述疾病类型对应的每种诊断类型的症状信息的步骤包括:
[0015]针对每种所述疾病类型,在历史诊断数据中搜索每种所述诊断类型的预设症状特征匹配的历史病历数据;
[0016]针对每种所述疾病类型,从所述每种诊断类型的预设症状特征匹配的历史病历数据中,提取每种所述诊断类型对应的原始信息,所述原始信息包括与所述问诊对应的病历段落、与所述望诊对应的图像、与所述闻诊对应的音频以及与所述切诊对应的脉冲信号;
[0017]在每种疾病类型对应的每种所述诊断类型的所述原始信息中,选取每种所述疾病类型对应的每种诊断类型的症状信息。
[0018]作为一种可选的实施方式,在本申请实施例第一方面中,所述在每种疾病类型对应的每种所述诊断类型的所述原始信息中,选取每种所述疾病类型对应的每种诊断类型的症状信息的步骤包括:
[0019]采用词频逆文件频率TFIDF算法分别将疾病类型对应的每种所述诊断类型的原始信息转换为第一向量;
[0020]采用词频逆文件频率TFIDF算法分别将每个所述预设症状特征转换为第二向量;
[0021]采用最佳匹配BM25算法对所述第一向量以及所述第二向量的相似度进行排序,得到排序信息;
[0022]针对每种疾病类型的每种诊断类型,基于所述排序信息选取相似度最高的预设数量个所述原始信息作为所述症状信息。
[0023]作为一种可选的实施方式,在本申请实施例第一方面中,所述分别对每种所述疾病类型对应的所有诊断类型的症状特征集合进行组合,得到每种疾病类型对应的参照体集合的步骤包括:
[0024]分别针对每种所述疾病类型对应的所有症状特征集合计算笛卡尔积组合,得到每个所述疾病类型对应的典型症状组合;
[0025]根据每种疾病类型的历史病历数据与所述典型症状组合的相似度,在每种所述疾病类型的所述典型症状组合中筛选所述相似度符合第二预设相似度条件的目标症状组合;
[0026]将每种所述疾病类型对应的所述目标症状组合,确定为每种所述疾病类型对应的所述参照体集合。
[0027]作为一种可选的实施方式,在本申请实施例第一方面中,所述分别对每种所述疾病类型对应的每种所述诊断类型的症状特征集合进行组合,得到每种所述疾病类型对应的参照体集合的步骤之后,还包括:
[0028]将所有所述疾病类型对应的所述参照体集合输入至预训练模型,所述预训练模型包括两个不同的Dropout Mask,所述预训练模型还包括预设损失函数,所述预设损失函数用于使得同种所述疾病类型的上下文向量表示的语义距离变近,并使得不同种疾病类型的上下文向量表示的语义距离变远;
[0029]在所述预训练模型的损失函数收敛时,根据所述预训练模型的输出数据,确定每种所述疾病类型对应的参照体集合的第三向量;
[0030]所述确定所述目标症状特征与每个预设参照人群具有的预设症状特征之间的相似度的步骤,包括:
[0031]将所述目标症状特征转换为第四向量;
[0032]根据所述第四向量与每个所述第三向量的相似度,确定每种所述目标症状特征与每个预设参照人群具有的预设症状特征之间的相似度。
[0033]作为一种可选的实施方式,在本申请实施例第一方面中,所述方法还包括:
[0034]获取疾病类型的种类信息;
[0035]基于所述种类信息,在图书数据中搜索每种所述疾病类型对应的文字段落;
[0036]从每种所述疾病类型对应的文字段落中,抽取每种疾病类型对应的四诊症状实
体,所述四诊症状实体包括问诊症状实体、闻诊症状实体、望诊症状实体以及切诊症状实体;
[0037]根据每种疾病类型对应的四诊症状实体,确定每种疾病类型对应的预设症状特征。
[0038]本申请实施例第二方面公开了一种病历信息处理装置,所述装置包括:
[0039]获取模块,用于获取目标病历信息;
[0040]提取模块,提取所述目标病历信息中的目标症状特征;
[0041]相似度确定模块,确定所述目标症状特征与每个预设参照人群具有的预设症状特征之间的相似度,所述预设参照人群为具有同类疾病类型的人群;
[0042]搜索模块,基于每个所述相似度以及预设相似度条件,在所有所述预设参照人群中搜索与所述目标症状特征匹配的目标参照人群;
[0043]诊断结果确定模块,根据所述目标参照人群对应的疾病类型,确定诊断结果。
[0044]本申请实施例第三方面公开了一种电子设备,所述电子设备包括:
[0045]一个或多个处理器;
[0046]存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述电子设备实现第一方面公开的病历信息处理方法。
[0047]本申请实施例第四方面公开了一种计算机可读存储介质,其上存储有计算机可读指令,所述计算机可读指令是的计算机执行本申请第一方面公开的病历信息处理方法。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种病历信息处理方法,其特征在于,所述方法包括:获取目标病历信息;提取所述目标病历信息中的目标症状特征;确定所述目标症状特征与每个预设参照人群具有的预设症状特征之间的相似度,所述预设参照人群为具有同类疾病类型的人群;基于每个所述相似度以及第一预设相似度条件,在所有所述预设参照人群中搜索与所述目标症状特征匹配的目标参照人群;根据所述目标参照人群对应的疾病类型,确定诊断结果。2.如权利要求1所述的方法,其特征在于,所述方法还包括:获取每种所述疾病类型对应的每种诊断类型的症状信息,所述诊断类型包括问诊、望诊、闻诊以及切诊,所述疾病类型包括疾病证型;分别根据每种所述疾病类型对应的每种所述诊断类型的症状信息,构建每种所述疾病类型对应的每种所述诊断类型的症状特征集合;分别对每种所述疾病类型对应的每种所述诊断类型的症状特征集合进行组合,得到每种所述疾病类型对应的参照体集合,所述参照体集合包括与所述疾病类型对应的所述预设症状特征。3.如权利要求2所述的方法,其特征在于,所述获取每种所述疾病类型对应的每种诊断类型的症状信息的步骤包括:针对每种所述疾病类型,在历史诊断数据中搜索每种所述诊断类型的预设症状特征匹配的历史病历数据;针对每种所述疾病类型,从所述每种诊断类型的预设症状特征匹配的历史病历数据中,提取每种所述诊断类型对应的原始信息,所述原始信息包括与所述问诊对应的病历段落、与所述望诊对应的图像、与所述闻诊对应的音频以及与所述切诊对应的脉冲信号;在每种疾病类型对应的每种所述诊断类型的所述原始信息中,选取每种所述疾病类型对应的每种诊断类型的症状信息。4.如权利要求3所述的方法,其特征在于,所述在每种疾病类型对应的每种所述诊断类型的所述原始信息中,选取每种所述疾病类型对应的每种诊断类型的症状信息的步骤包括:采用词频逆文件频率TFIDF算法分别将疾病类型对应的每种所述诊断类型的原始信息转换为第一向量;采用词频逆文件频率TFIDF算法分别将每个所述预设症状特征转换为第二向量;采用最佳匹配BM25算法对所述第一向量以及所述第二向量的相似度进行排序,得到排序信息;针对每种疾病类型的每种诊断类型,基于所述排序信息选取相似度最高的预设数量个所述原始信息作为所述症状信息。5.如权利要求2所述的方法,其特征在于,所述分别对每种所述疾病类型对应的所有诊断类型的症状特征集合进行组合,得到每种疾病类型对应的参照体集合的步骤包括:分别针对每种所述疾病类型对应的所有症状特征集合计算笛卡尔积组合,得到每个所述疾病类型对应的典型症状组合;
根据每种疾病类型的历史病历数据与...

【专利技术属性】
技术研发人员:胡意仪阮晓雯陈远旭
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1