【技术实现步骤摘要】
一种长时生理信号时间序列的样本数据的扩充方法及系统
本公开属于样本扩充
,尤其涉及一种长时生理信号时间序列的样本数据的扩充方法及系统,是在长时间序列分析中均可用此方法。
技术介绍
本部分的陈述仅仅是提供了与本公开相关的
技术介绍
信息,不必然构成在先技术。生理信号长时间序列存在样本数据少的问题,例如:在利用心率变异性分析(HRV)对心血管疾病进行诊断、预测工作时经常会遇到样本量不足的问题,这对接下来利用机器学习训练分类模型的分类效果有很大的影响。目前,样本数据合成方法在很多数据处理领域中均有研究。在处理不均衡数据的方法研究中,随机过抽样是合成新样本数据的最基本的方法。该方法首先随机选择并复制原始样本,然后将新生成样本集合添加进原始样本集合中,得到新的样本集合。新合成的数据是原始数据的简单复制,可能会导致分类器出现过拟合现象。尤其是分类器会对重复的样本产生多条规则,使这些规则过于具体化。为解决过拟合问题,ChawlaNV提出基于人工合成少数类过抽样技术(SMOTE算法)。SMOTE算法的思想是寻找少数 ...
【技术保护点】
1.一种长时生理信号时间序列的样本数据的扩充方法,其特征是,包括:/n获取第一长时生理信号时间序列及第二长时生理信号时间序列,并分别进行数据预处理,其中,第一长时生理信号时间序列及第二长时生理信号时间序列为取自不同的样本库的不同类信号数据;/n选取第一长时生理信号时间序列和第二长时生理信号时间序列对应的与时间尺度无明显关联且有明显差异性的指标;/n使用多时间尺度分析将第一长时生理信号时间序列和第二长时生理信号时间序列按时间尺度分段;/n根据指标随时间尺度的变化初步筛选无关联性指标;/n验证初步筛选指标与时间尺度无明显关联性及选取指标在不同时间尺度有差异性;/n将不同时间尺度 ...
【技术特征摘要】
1.一种长时生理信号时间序列的样本数据的扩充方法,其特征是,包括:
获取第一长时生理信号时间序列及第二长时生理信号时间序列,并分别进行数据预处理,其中,第一长时生理信号时间序列及第二长时生理信号时间序列为取自不同的样本库的不同类信号数据;
选取第一长时生理信号时间序列和第二长时生理信号时间序列对应的与时间尺度无明显关联且有明显差异性的指标;
使用多时间尺度分析将第一长时生理信号时间序列和第二长时生理信号时间序列按时间尺度分段;
根据指标随时间尺度的变化初步筛选无关联性指标;
验证初步筛选指标与时间尺度无明显关联性及选取指标在不同时间尺度有差异性;
将不同时间尺度的指标作为不同样本的指标进行样本扩充,获得扩充样本集合。
2.如权利要求1所述的一种长时生理信号时间序列的样本数据的扩充方法,其特征是,所述第一长时生理信号时间序列及第二长时生理信号时间序列的样本据中采集方法相同,并对长时生理信号时间序列进行标记。
3.如权利要求1所述的一种长时生理信号时间序列的样本数据的扩充方法,其特征是,对预处理后的数据计算时间尺度下的长度,时间序列按时间尺度分段,计算每一段序列的指标。
4.如权利要求1所述的一种长时生理信号时间序列的样本数据的扩充方法,其特征是,针对所计算的指标分别在时域、频域和非线性域上选取关键指标。
5.如权利要求1所述的一种长时生理信号时间序列的样本数据的扩充方法,其特征是,应用多时间尺度分析方法将指标拓展到多个时间尺度上,得到两组样本的不同指标在多个时间尺度上的统计差异,分析中将同一指标在所有段中计算值的平均值作为该指标在该样本中的最终计算结果。
6.如权利要求5所述的一种长时生理信号时间序列的样本数据的扩充方法,其特征是,得到两组样本的不同指标在多个时间尺度上的统计差异后,应用studentt检验来确定两组数据是否存在显著性差异,根据指标随时...
【专利技术属性】
技术研发人员:魏守水,王春元,崔怀杰,谢佳静,江兴娥,
申请(专利权)人:山东大学,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。