【技术实现步骤摘要】
本专利技术涉及计算机,特别是一种基于svm的非平衡大规模数据集的训练方法。
技术介绍
1、传统的支持向量机(svm)是一种基于统计学习理论的监督学习方法,它可以通过构造一个最优的超平面来实现对数据的分类或回归。传统的支持向量机(svm)主要用于处理二分类问题,即将数据分为两个类别,如判断一张图片中是否有人脸,或者判断一封邮件是否是垃圾邮件等。除此之外,传统的支持向量机(svm)也可以通过一些扩展方法来处理多分类问题和回归问题。多分类问题是指将数据分为多个类别,如识别手写数字,或者识别动物的种类等。回归问题是指预测一个连续的数值,如预测疾病的发病率,或者预测楼市的房价走势等。传统的支持向量机(svm)在这些问题上都有着广泛的应用和良好的效果,因此是一种非常强大和实用的机器学习算法;当数据规模很大时,传统的单机支持向量机(svm)的计算效率和性能会受到限制,因为它需要在单个机器上处理所有的数据和模型参数。这会导致模型训练时间以及模型的性能受到很大影响。
2、非平衡数据集是指数据集中不同类别的样本数量相差很大,例如,在信用卡欺诈检
...【技术保护点】
1.一种基于SVM的非平衡大规模数据集的训练方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于SVM的非平衡大规模数据集的训练方法,其特征在于,步骤S1中对所需训练的数据进行清洗、冗余数据剔除、将数据统一整合为固定格式并归一化处理包括:
3.根据权利要求1所述的一种基于SVM的非平衡大规模数据集的训练方法,其特征在于,步骤S2中进行正负样本比例对比,并输出若干个平衡数据集包括:
4.根据权利要求1所述的一种基于SVM的非平衡大规模数据集的训练方法,其特征在于,步骤S3中构建基于随机梯度下降优化的SVM模型并构建Fli
...【技术特征摘要】
1.一种基于svm的非平衡大规模数据集的训练方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于svm的非平衡大规模数据集的训练方法,其特征在于,步骤s1中对所需训练的数据进行清洗、冗余数据剔除、将数据统一整合为固定格式并归一化处理包括:
3.根据权利要求1所述的一种基于svm的非平衡大规模数据集的训练方法,其特征在于,步骤s2中进行正负样本比例对比,并输出若干个平衡数据集包括:<...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。