【技术实现步骤摘要】
一种面向医疗数据的多因素相关性交互式分析方法
本专利技术属于多因素相关性分析
,特别涉及一种面向医疗数据的多因素相关性交互式分析方法。
技术介绍
医学统计学是应用统计学的基本原理和方法,主要研究医学及相关领域数据信息的搜集、整理、分析、表达和解释的科学。在临床医学研究中,根据已有的临床医疗数据,结合现有的医学知识,通过计算皮尔森相关系数等统计学特征进行多因素相关性分析,确定对疾病发展影响较大的关键因素。但是医疗数据高维复杂,传统方法需要繁重的计算,且结果抽象难以理解,不利于医生开展诊疗和科研;疾病的发展常与多种因素相关,目前传统的方法只能测算两个因素之间的相关性,影响结果的有效性。综上,亟需一种新的面向高维医疗数据的多因素相关性交互式分析方法。
技术实现思路
本专利技术的目的在于提供一种面向医疗数据的多因素相关性交互式分析方法,以解决上述存在的一个或多个技术问题。本专利技术能够交互式地对高维医疗数据进行分析,可视化展示影响疾病发展的关键因素。为达到上述目的,本专利技术采用以下技术方案:本专利技术的一种面向医疗数据的多因素相关性交互式分析方法,包括以下步骤:步骤1,将采集的医疗数据进行处理,将处理后的医疗数据按照患者病案号进行关联,获得每个患者的就诊序列;其中,处理包括标准化处理;步骤2,使用t-SNE算法将步骤1获得的就诊序列映射到二维平面上,形成不同的特征群体;根据需要从特征群体中选择出特征群体;步骤3,设定疾病表征指标;对步骤2中选择的特征 ...
【技术保护点】
1.一种面向医疗数据的多因素相关性交互式分析方法,其特征在于,包括以下步骤:/n步骤1,将采集的医疗数据进行处理,将处理后的医疗数据按照患者病案号进行关联,获得每个患者的就诊序列;其中,处理包括标准化处理;/n步骤2,使用t-SNE算法将步骤1获得的就诊序列映射到二维平面上,形成不同的特征群体;根据需要从特征群体中选择出特征群体;/n步骤3,设定疾病表征指标;对步骤2中选择的特征群体所具有的特征进行特征选择,确定与所述疾病表征指标相关性的特征顺序;/n步骤4,采用统计学度量指标对步骤3中选择的特征之间的相关性进行度量,获得具有统计学意义的结果,完成多因素相关性交互式分析。/n
【技术特征摘要】
1.一种面向医疗数据的多因素相关性交互式分析方法,其特征在于,包括以下步骤:
步骤1,将采集的医疗数据进行处理,将处理后的医疗数据按照患者病案号进行关联,获得每个患者的就诊序列;其中,处理包括标准化处理;
步骤2,使用t-SNE算法将步骤1获得的就诊序列映射到二维平面上,形成不同的特征群体;根据需要从特征群体中选择出特征群体;
步骤3,设定疾病表征指标;对步骤2中选择的特征群体所具有的特征进行特征选择,确定与所述疾病表征指标相关性的特征顺序;
步骤4,采用统计学度量指标对步骤3中选择的特征之间的相关性进行度量,获得具有统计学意义的结果,完成多因素相关性交互式分析。
2.根据权利要求1所述的一种面向医疗数据的多因素相关性交互式分析方法,其特征在于,步骤1中,所述将采集的医疗数据进行处理的具体步骤包括:
(1.1),消除医疗数据中的无关特征和隐私数据;其中,无关特征包括:患者姓名、患者序号,隐私数据包括:患者身份证号、患者手机号;
(1.2),消除医疗数据中的缺失值和异常值;其中,缺失值包括:空值、null、“-”,异常值包括:违反医学知识的值、违反常识的值;
(1.3),消除医疗数据中完全重复的数据;
(1.4),将医疗数据中的数值数据进行标准化处理,包括:对于同一特征数据xi,
式中,X为某一数值特征的所有值的集合,xi表示X中的第i个元素,i=1,2,3,...n,n表示元素总数,min(X)表示集合X中的最小值,max(X)表示集合X中的最大值;
(1.5),将医疗数据中的类别型数据进行编码,获得编码向量Y;其中,编码格式为:
其中,yk表示编码向量中的第k个值,k=1,2,3,...,m,m表示编码向量中的元素数目,j表示数据所属的类别编号。
3.根据权利要求1所述的一种面向医疗数据的多因素相关性交互式分析方法,其特征在于,步骤1中,获得的每个患者的就诊序列T,表达式为:
T={xa,yb,zc,...},
式中,xa,yb,zc,a,b,c=1,2,3,...l,分别代表不同类型的医疗数据,属于同一个患者;l表示每一类医疗数据的元素数目;
步骤2中,根据需要从特征群体中选择出待研究特征群体G,表达式为:
G={T1,T2,...,Tp,…,Td},
式中,Tp代表待研究特征群体中第p个患者的就诊序列,d=1,2,3,...,d,d表示待研究特征群体中患者数量。
4.根据权利要求1所述的一种面向医疗数据的多因素相关性交互式分析方法,其特征在于,步骤3中具体包括:
(3.1),设定疾病表征指标时,通过交互式指定;
(...
【专利技术属性】
技术研发人员:钱步月,刘涛,郑莹倩,刘璇,吕欣,许靖琴,侯梦薇,吴风浪,
申请(专利权)人:西安交通大学,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。