不平衡数据的预测模型生成方法、装置、设备和存储介质制造方法及图纸

技术编号：41010420 阅读：10 留言：0更新日期：2024-04-18 21:46

本发明专利技术公开了不平衡数据的预测模型生成方法、设备和存储介质，所述方法包括步骤：确定不同类的聚类中心，并分别计算各数据点到其对应的聚类中心的欧式距离；确定距离聚类中心最近和最远数据点的位置；分别计算每一类的数据集的超球面的有效半径；根据超球面的有效半径计算各类对应的空间分散度；在建立预测模型时，用所述空间分散度对支持向量机的惩罚因子进行修正。由于本发明专利技术考虑了数据点在空间的聚集和分散情况对分类结果的影响，因此获得了更好的分类效果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据分析领域，特别涉及不平衡数据的预测模型生成方法、装置、设备和存储介质。

技术介绍

1、不平衡数据分类问题其产生的原因包括，大多数分类学习方法都有一个共同的基本假设，即不同类别的训练样本数目相当；如果不同类别的训练样例数目稍有差别，通常影响不大，但是在不同类别的训练样例的数目差别很大是，就会对学习过程造成困扰。

2、现有技术处理不平衡数据分类问题时，包括阈值移动法，即，通过调整不同类数据集数目的比值作为惩罚系数，以降低分类结果偏向多数类的程度，进而达到解决类不平衡的目的。

3、专利技术人经过研究发现，现有技术中的阈值移动法至少还存在以下缺陷：

4、单纯的调整不同类数据集数目的比值来作为惩罚系数，无法获得良好的分类效果。

5、公开于该
技术介绍
部分的信息仅仅旨在增加对本专利技术的总体背景的理解，而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。

技术实现思路

1、本专利技术的目的在于可以使分类预测...

【技术保护点】

1.一种不平衡数据的预测模型生成方法，其特征在于，包括步骤：

2.根据权利要求1所述的不平衡数据的预测模型生成方法，其特征在于，还包括：

3.根据权利要求1或2所述的不平衡数据的预测模型生成方法，其特征在于，还包括数据后处理-去噪的步骤，包括：

4.根据权利要求1或2所述的不平衡数据的预测模型生成方法，其特征在于，所述分别计算每一类的数据集的超球面的有效半径，包括：

5.根据权利要求1所述的不平衡数据的预测模型生成方法，其特征在于，用于计算各类对应的空间分散度的公式包括：

6.根据权利要求5所述的不平衡数据的预测模型生成方法，其...

【技术特征摘要】

1.一种不平衡数据的预测模型生成方法，其特征在于，包括步骤：

2.根据权利要求1所述的不平衡数据的预测模型生成方法，其特征在于，还包括：

3.根据权利要求1或2所述的不平衡数据的预测模型生成方法，其特征在于，还包括数据后处理-去噪的步骤，包括：

4.根据权利要求1或2所述的不平衡数据的预测模型生成方法，其特征在于，所述分别计算每一类的数据集的超球面的有效半径，包括：

5.根据权利要求1所述的不平衡数据的预测模型生成方法，其特征在于，用于计算各类对应的空间分散度的公式包括：

6.根据权利要求5所述的不平衡数据的...

【专利技术属性】
技术研发人员：花靖，蒋秀，于超，谷成林，逄铭玉，傅建斌，
申请(专利权)人：中国石油化工股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人