【技术实现步骤摘要】
一种针对创面微环境数据的多元时间序列数据增强方法
[0001]本专利技术涉及医疗领域和机器学习
,具体涉及采用机器学习方法分析创面微环境数据时的一种多元时间序列数据增强方法。
技术介绍
[0002]近些年来,数据挖掘、人工智能等技术飞速发展,已经在应用科学和工程的各个领域取得了突破性的进展,其准确性、高效性也得到了各个领域专家的青睐。现有的主流数据分析方法,尤其是基于深度神经网络的有监督学习模型,是以数据量趋近无穷大时的渐进理论为研究基础的。因此,大量的数据样本是保证得到一个高预测准确率模型的基本前提。但在医疗领域,由于临床数据的保密性、不完整性,以及部分病例的罕见性、对患者隐私的保护等原因,通常很难获得大量的、可用于分析的临床诊断数据样本。创伤是临床高发病症,创面微环境参数变化趋势对创面的愈合至关重要,如何根据创面微环境数据对创面状态进行快速判断以指导医生的诊断治疗具有重要的现实意义。但由于采集的困难,大量的、标准的创面微环境数据并不容易获得。如何根据少量创面微环境数据来进行智能诊断,是相关领域专家研究的热点。如今解 ...
【技术保护点】
【技术特征摘要】
1.一种针对创面微环境数据的多元时间序列数据增强方法,其特征在于步骤如下:步骤1:输入待增强的创面微环境数据集X,该数据集对应的标签集Y,以及可配置的参数:寻找的近邻数量K、基准样本权重参数ω;步骤2:从数据集X中随机选取一个样本作为基准样本,记为X0,其对应的类别标签为Y0;步骤3:计算数据集X中所有类别为Y0的数据样本与X0之间的基于DTW规整后的距离,寻找最近的K个样本,计算这K个所选样本分别相对于X0的DTW规整序列,与x0组成待平均数据集AvgTS,其大小为K+1;步骤4:生成随机权重集W;权重集W={ω,ω1,
…
,ω
K
},ω是基准样本权重值,是一个可配置的输入参数,{ω1,
…
,ω
K
}是K个近邻样本的权重,通过伪随机数生成的方式生成,并将其规整为和为1
‑
ω的K个权重值;步骤5:计算数据集AvgTS每一时间步的数据按照W中的权重进行的加权平均值,构成均值时间序列X
new
;步骤6:添加噪声:对求得的均值序列X
new
添加高斯噪声,作为一条新的数据样本,且其标签与基准样本X0一致。2.根据权利要求1所述的一种针对创面微环境数据的多元时间序列数据增强方法,其特征在于:所述步骤1中的创面微环境数据集X={X1,X2,
…
,X
N
},其中X
i
={X
i,1
,X
i,2
,
…
,X
i,T
}为一个多元时间序列,其中X
i,j
={x1,x2,
…
,x
n
},N为样本集数量,T为每个样本的时间步长,n为每一时间步内的特征数;样本集...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。