【技术实现步骤摘要】
Component Analysis)。
技术实现思路
[0007]为解决上述技术问题,本专利技术基于经典的主元分析、灰色关联分析和全连接神经网络,提出了一种基于数据驱动的肾移植术后肺部感染风险因素挖掘方法。具体涉及到如何对临床采集的数据进行清洗,如何利用主元分析对临床数据进行降维后计算病例数据的综合贡献度,如何通过灰色关联分析计算得到所有可能的候选因素与肺部感染情况之间的关联度,以及如何通过全连接神经网络感染预测器进行全局多重搜索以选定最佳的风险因素组。
[0008]本专利技术采用的技术方案为:一种基于数据驱动的肾移植术后肺部感染风险因素挖掘方法,具体步骤如下:
[0009]S1、利用主元分析法对临床数据集进行量化;
[0010]S2、对量化后的数据进行降维处理;
[0011]S3、基于步骤S2得到的数据降维结果,分别计算各病例样本对整个数据集的综合贡献度;
[0012]S4、基于步骤S2得到的病例综合贡献度,分别计算各候选风险因素相对于肺部感染出现之间的关联度,并以降序排序;
[0013]S5、基于全连接神经网络模型设计一个肺部感染预测器;
[0014]S6、利用步骤S5设计的预测器,对步骤S4中排序的候选风险因素进行增量式多重搜索预测,根据最高预测精度确定最佳风险因素集。
[0015]进一步地,所述步骤S1中,对全体病例数据集进行量化,具体如下:
[0016]假定给定的临床数据集S有M个病例,每个病例包含N个可能的肺部感染候选因素,且且表示实数域。原数据集S如式(1 ...
【技术保护点】
【技术特征摘要】
1.一种基于数据驱动的肾移植术后肺部感染风险因素挖掘方法,具体步骤如下:S1、利用主元分析法对临床数据集进行量化;S2、对量化后的数据进行降维处理;S3、基于步骤S2得到的数据降维结果,分别计算各病例样本对整个数据集的综合贡献度;S4、基于步骤S2得到的病例综合贡献度,分别计算各候选风险因素相对于肺部感染出现之间的关联度,并以降序排序;S5、基于全连接神经网络模型设计一个肺部感染预测器;S6、利用步骤S5设计的预测器,对步骤S4中排序的候选风险因素进行增量式多重搜索预测,根据最高预测精度确定最佳风险因素集。2.根据权利要求1所述的一种基于数据驱动的肾移植术后肺部感染风险因素挖掘方法,其特征在于,所述步骤S1中,对全体病例数据集进行量化,具体如下:假定给定的临床数据集S有M个病例,每个病例包含N个可能的肺部感染候选因素,且假定给定的临床数据集S有M个病例,每个病例包含N个可能的肺部感染候选因素,且表示实数域;原数据集S如式(1)所示量化成S
norm
∈[
‑
1,1]
N
×
M
,S
norm
表示是原数据集矩阵经过量化以后得到的数据矩阵;其中,和S
r
分别代表数据矩阵S
norm
和S中的第r个行向量,而和则分别表示原矩阵S中第r个行向量中风险因素的最大值和最小值,表示向量S
r
中所有元素的均值,r={0,1,
…
,N
‑
1}。3.根据权利要求1所述的一种基于数据驱动的肾移植术后肺部感染风险因素挖掘方法,其特征在于,所述步骤S2中,具体如下:S21、计算特征值和特征矩阵;对量化后的行向量执行零均值处理,即其中,表示得到的第r个零均值向量,表示行向量中所有元素的均值;把得到的零均值矩阵记为X,计算得到X的协方差矩阵C
X
=(X*X
T
)/M,T表示矩阵的转置;计算协方差矩阵C
X
的N个特征值λ
i
及对应的特征向量ξ
i
,约束条件为:|λ
i
I
‑
C
X
|=0且(λ
i
I
‑
C
X
)ξ
i
=0,其中,I表示一个N阶单位矩阵,i={0,1,2,
…
,N
‑
1}。把N个ξ
i
按对应特征值λ
i
的大小降序排列,组成一个特征向量排序矩阵P;S22、计算累计贡献率;先分别计算每一个主元的贡献率ψ
i
,计算规则如式(2):再计算矩阵C
X
中n个主元的累计贡献率预先设定一个累计贡献率阈值θ,当Φ
n
≥θ时得到最优的主元数量n;S23、计算矩阵X的降维结果;
选择矩阵P中的前n个特征向量ξ0、ξ1、ξ2、
…
、ξ
n
‑1组成一个新矩阵P
sub
,据此计算X的降维结果矩阵X
dim
,其中,X
dim
=P
sub
*X。4.根据权利要求1所述的一种基于数据驱动的肾移植术后肺部感染风险因素挖掘方法,其特征在于,所述步骤S3中,具体如下:如式(3)所示,以矩阵运算的形式整体计算各病例数据在整体样本的综合贡献度分值,构成一个列向量F:其中,T表示矩阵的转置,ψ
↓
表示直接由n个主元贡献率ψ
i
(i=0,1,2,
…
,n
‑
1)组成的一个n维列向量。5.根据权利要求1所述的一种基于数据驱动的肾移植术后肺部感染风险因素挖掘方法,其特征在于,所述步骤S4中,具体如下:S41、参数的初始化;把从步骤S3中计算得到的病例贡献度列向量F,设置为临床数据集量化矩阵中全部候选风险因素分析的一个参考向量;S42、计算差异矩阵D;根据规则计算量化矩阵与贡献度列向量F的差异并做绝对值处理;然后再计算差异矩阵D中各列数据最大值构成的行向量和最小值构成的行向量min(.)和max(.)分别表示...
【专利技术属性】
技术研发人员:纪禄平,张欣宇,杨纤雪,陈波,
申请(专利权)人:电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。