System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据分析领域,特别涉及高维数据的预测模型生成方法、装置、设备和存储介质。
技术介绍
1、不平衡数据分类问题其产生的原因包括,大多数分类学习方法都有一个共同的基本假设,即不同类别的训练样本数目相当;如果不同类别的训练样例数目稍有差别,通常影响不大,但是在不同类别的训练样例的数目差别很大是,就会对学习过程造成困扰。
2、现有技术处理不平衡数据分类问题时,包括阈值移动法,即,通过调整不同类数据集数目的比值作为惩罚系数,以降低分类结果偏向多数类的程度,进而达到解决类不平衡的目的。
3、专利技术人经过研究发现,现有技术中的阈值移动法至少还存在以下缺陷:
4、单纯的调整不同类数据集数目的比值来作为惩罚系数,无法获得良好的分类效果。
5、公开于该
技术介绍
部分的信息仅仅旨在增加对本专利技术的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。
技术实现思路
1、本专利技术的目的在于可以使分类预测模型获得更好的分类效果。
2、本专利技术提供了一种高维数据的预测模型生成方法,所述高维数据为不平衡数据,包括步骤:
3、s11、降低数据的维度,包括:对所述数据的所有特征按照影响程度从高到低进行排序,并通过计算累积重要程度的方式从特征集中提取出累积重要程度值大于预设值的特征子集;
4、s12、确定各个类的聚类中心后,分别计算每一类的数据集的超球面的半径;
< ...【技术保护点】
1.一种高维数据的预测模型生成方法,所述高维数据为不平衡数据,其特征在于,包括步骤:
2.根据权利要求1所述的高维数据的预测模型生成方法,其特征在于,还包括:
3.根据权利要求1或2所述的高维数据的预测模型生成方法,其特征在于,还包括数据后处理-去噪的步骤,包括:
4.根据权利要求3所述的高维数据的预测模型生成方法,其特征在于,所述降低数据的维度,包括:
5.根据权利要求1所述的高维数据的预测模型生成方法,其特征在于,所述确定各个类的聚类中心后,分别计算每一类的数据集的超球面的半径,包括:
6.根据权利要求5所述的高维数据的预测模型生成方法,其特征在于,所述分别计算每一类的数据集的超球面的有效半径,包括:
7.根据权利要求1所述的高维数据的预测模型生成方法,其特征在于,用于计算各类对应的空间分散度的公式包括:
8.根据权利要求7所述的高维数据的预测模型生成方法,其特征在于,所述在建立预测模型时,用所述空间分散度对支持向量机的惩罚因子进行修正,包括:
9.一种高维数据的预测模型生成装置,
10.根据权利要求9所述的高维数据的预测模型生成装置,其特征在于,还包括:
11.根据权利要求10所述的高维数据的预测模型生成装置,其特征在于,还包括:
12.一种高维数据的预测模型生成设备,其特征在于,包括:
13.一种存储介质,其特征在于,包括软件程序,所述软件程序适于由处理器执行如权利要求1-8中任一所述高维数据的预测模型生成方法的步骤。
...【技术特征摘要】
1.一种高维数据的预测模型生成方法,所述高维数据为不平衡数据,其特征在于,包括步骤:
2.根据权利要求1所述的高维数据的预测模型生成方法,其特征在于,还包括:
3.根据权利要求1或2所述的高维数据的预测模型生成方法,其特征在于,还包括数据后处理-去噪的步骤,包括:
4.根据权利要求3所述的高维数据的预测模型生成方法,其特征在于,所述降低数据的维度,包括:
5.根据权利要求1所述的高维数据的预测模型生成方法,其特征在于,所述确定各个类的聚类中心后,分别计算每一类的数据集的超球面的半径,包括:
6.根据权利要求5所述的高维数据的预测模型生成方法,其特征在于,所述分别计算每一类的数据集的超球面的有效半径,包括:
7.根据权利要求1所述的高维数据...
【专利技术属性】
技术研发人员:花靖,蒋秀,逄铭玉,于超,谷成林,靳彦欣,傅建斌,
申请(专利权)人:中国石油化工股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。