一种迭代式一维数据增强方法技术

技术编号：38001880 阅读：18 留言：0更新日期：2023-06-30 10:15

一种迭代式一维数据增强方法，在对一维数据进行数据增强的过程中，建立迭代式的增强基准更新策略，使得前期通过增强生成的数据，参与到后续的数据增强中来，该过程可以通过不断迭代，以使总数据规模达到最终需求。本方法解决了同类型的数据增强方法，原始数据利用率低下的问题，同时引入迭代式的数据增强方法，解决了增强后数据分布不合理的问题，引入的迭代式的数据增强方法保证了增强后的数据可以分布在原始样本点在高维空间体表面和内部。将此数据增强方法应用于一维数据的数据增强中，有助提升数据增强过程中原始数据的利用率和数据增强的合理性。据增强的合理性。据增强的合理性。

全部详细技术资料下载

【技术实现步骤摘要】
一种迭代式一维数据增强方法

[0001]本专利技术属数据计算机应用与处理技术
，具体为一种迭代式一维数据增强方法。

技术介绍

[0002]数据增强是一种数据扩充技术，指的是利用有限的数据创造尽可能多的利用价值，是后续分析处理数据的任务基础。虽然现在各种任务的公开数据集有很多，但是对于某些任务来说数据量也远远不够，而公司或者学术界去采集、制作这些数据的成本往往较高。目前，常用的对于一维数据的数据增强方案有：添加噪声、SMOTE等。但是这些方法仍然存在一些问题。
[0003]首先，难以保证数据增强前后的数据分布一致性。现有的数据增强方法，往往对数据的原始分布做了默认处理，一旦假设的分布特征与数据的实际分布特征不同，则会使得增强后的数据反而掩盖了原始数据特征，对后续的数据使用过程产生严重的干扰。
[0004]另外，数据增强范围较小，例如现有的SMOTE数据增强方法，每次仅利用两个原始数据生成新数据，这使得增强后数据只分布在原始样本点连线所围成的空间多面体边缘上，增强后数据分布位置单一，且原始数据利用率低下。<br/>[0005]本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种迭代式一维数据增强方法，其特征在于，具体步骤如下：S1，取待增强的数据集A：A＝{x1,x2,
…
x
n
}其中，x
i
为数据集A的第i条数据样本，样本形式为一维向量，i的取值范围为[1,n]，n为数据A中的样本总数，需要保证样本数量大于1，即n的取值范围为[2,∞]；S2，为了控制增强后的数据集大小，即S5中集合A最终的数据样本个数，需要确定数据最小需求总量S，S的取值范围为(n+n
×
K,∞]，单次增强的数据量K，K的取值范围为(1,n]；S3，对于数据集A中的每一条数据样本，按照公式(1)进行数据增强：y
i
＝x
i
+λ
×
(x
i
‑
x
j
) (1)其中，λ为取值范围[0,1]的随机数,y
i
表示由x
i
，x
j
为基础生成的新数据样本，x
j
为数据集A的第j条数据样本，j的取值如下：由数据y
i
组成集合B：B＝{y1,y2,
…
y
n
}S4，建立迭代增强策略，循环执行下述步骤S41
‑
S42，直至数据总量N超过数据最小需求量S，N的计算方式如下：N＝p
×
K+2
×
n其中，p为当前循环执行次数，其初值为1，每次循环递增1；S5，将集合B并入数据集A，完成数据集A的数据增强。2.根据权利要求1所述的一种客观评价体系的权值优化方法，其特征在于：所述步骤(4)具体如下：S41，从数据集合B中取得样本y
p
，与原始数据集合A中的每一条数据x
i
按照公式(2)计算欧式距离L
...

【专利技术属性】
技术研发人员：王志博，王东，冯李航，张为公，
申请(专利权)人：东南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人