【技术实现步骤摘要】
一种基于相似性度量的病案查找方法及系统
本专利技术涉及医疗领域的相似病案查找技术,具体涉及一种基于相似性度量的病案查找方法及系统,可实现异构医疗信息下的相似病案查找并将相似病案基于相似性排序。
技术介绍
病案是指按规范记录病人疾病表现和诊疗情况的档案,主要包括:病人基本信息、病人病历信息、检查信息、医嘱信息、诊断信息、治疗方案、病情反馈等。病案描述了病人就诊过程中的完整病情,通过数据信息的形式将病人病情进行保存。以病案为对象的研究分析具有重要意义,本专利技术中的病案查找就是如此,例如当县级以下医院医生对于前来就诊病人的病情无法把握时,可以基于本专利技术通过查找相似病案中专家的治疗方案辅助当前病人的诊断和治疗。因此,病案查找的研究有着极具理论与实践意义。相似病案查找主要基于病案的相似排序。病案的相似排序对于理解病案的类型、识别病案之间的关系及预测病案中病情的趋势有着极其重要的基础性作用,其是病案应用的前提和基础。病案的相似排序是指对于指定的病案,将病案库中的所有病案与该病案进行比较,然后基于相似性的大小对病案进行排序。其中,最主要的工作就是如何判定两个病案之间的相似 ...
【技术保护点】
1.一种基于相似性度量的病案查找方法,其特征在于实施步骤包括:1)针对查询病案集合A构建病案组得到病案组集合C;2)对于病案组集合C进行病案组的相似标签赋值得到带相似标签的病案组数据集合D;3)构建机器学习模型,并通过带相似标签的病案组数据集合D完成对机器学习模型的训练,所述机器学习模型通过训练建立了病案组、病案组相似度之间的映射关系;4)将目标病案、查询病案集合A中所有病案一起输入到机器学习模型,得到目标病案和查询病案集合A中所有病案之间的相似性度量值,选择相似性度量值最高的N个病案输出。
【技术特征摘要】
1.一种基于相似性度量的病案查找方法,其特征在于实施步骤包括:1)针对查询病案集合A构建病案组得到病案组集合C;2)对于病案组集合C进行病案组的相似标签赋值得到带相似标签的病案组数据集合D;3)构建机器学习模型,并通过带相似标签的病案组数据集合D完成对机器学习模型的训练,所述机器学习模型通过训练建立了病案组、病案组相似度之间的映射关系;4)将目标病案、查询病案集合A中所有病案一起输入到机器学习模型,得到目标病案和查询病案集合A中所有病案之间的相似性度量值,选择相似性度量值最高的N个病案输出。2.根据权利要求1所述的基于相似性度量的病案查找方法,其特征在于,步骤1)的详细步骤包括:1.1)针对查询病案集合A中的所有病案,将其进行两两全排列组合得到病案组集合B,病案组集合B中的元素为病案组、且每个病案组由两个病案组成;1.2)针对病案组集合B随机选择部分病案组得到病案组选择集合C0;针对病案组集合B根据指定的多种相似值指标分别计算相似值指标值,且针对不同的相似值指标,分别基于相似值指标值进行降序排列得到病案组有序集合Bi;针对所有的病案组有序集合Bi,分别基于相似值指标概率分配选择生成病案组选择集合Ci,所述指定的多种相似值指标包括欧氏距离、余弦距离、杰卡德距离、调整余弦距离中的至少两种;1.3)将病案组选择集合C0、所有的病案组选择集合Ci进行集合合并得到病案组集合C。3.根据权利要求2所述的基于相似性度量的病案查找方法,其特征在于,所述基于相似值指标概率分配选择生成病案组选择集合Ci时,病案组有序集合Bi中每一个病案组的随机选择的概率如式(1)所示;式(1)中,P(SMi)为病案组有序集合Bi中第i个病案组被选取的概率,SMi为病案组有序集合Bi中第i个病案组的相似值指标值,f(SMj)为病案组有序集合Bi中第i个病案组的相似值经规整化的结果,m为病案组有序集合Bi中病案组的个数,f(SMj)的函数表达式如式(2)所示;式(2)中,SM1为病案组有序集合Bi中第1个病案组的相似值指标值,SMm为病案组有序集合Bi中第m个病案组的相似值指标值,m为病案组有序集合Bi中病案组的个数。4.根据权利要求1所述的基于相似性度量的病案查找方法,其特征在于,步骤2)的详细步骤包括:2.1)将病案组集合C表示为病案组集合矩阵b,所述病案组集合矩阵b的每一行表示一个病案,病案的前n列分别表示该病案的n个特征、最后一列特征s为该病案的诊断信息;2.2)根据所述病案组集合矩阵b确定病案的每一个特征的权重值;2.3)通过病案的特征之间的相似性以及特征对应的权重计算病案组集合C中每个病案组的相似值s,进而得到带相似标签的病案组集合D。5.根据权利要求4所述的基于相似性度量的病案查找方法,其特征在于,步骤2.2)的详细步骤包括:根据式(4)计算病案的每一个特征的原始权重值,针对所有特征的原始权重值进行归一化处理作为每一个特征最终的权重值;式(4)中,yi'表示病案的每i个特征的原始权重值,表示病案组集合矩阵b所有病案的第i列特征构成的特征向量;表示病案组集合矩阵b所有病案的诊断信息s构成的诊断信息特征向量;σi表示病案组集合矩阵b所有病案的第i列特征的方差。6.根据权利要求4所述的基于相似性度量的病案查找方法,其特征在于,步骤2.3)中计算病案组集合C中每个病案组的相似值s的函数表达式如式(6)所示;式(6)中,sij表示由病案i与病案j构成的病...
【专利技术属性】
技术研发人员:朱培栋,张振宇,王平,熊荫乔,刘欣,郭敏捷,冯璐,郑昱,李勇,
申请(专利权)人:长沙学院,
类型:发明
国别省市:湖南,43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。