一种耐噪在线多分类核学习算法制造技术

技术编号：20390706 阅读：57 留言：0更新日期：2019-02-20 03:10

本发明专利技术涉及一种基于自适应ramp损失函数的耐噪在线多分类核学习算法。通过引入核函数构造非线性多分类器，针对基于批处理技术的多分类方法无法高效处理数据流问题，而现有在线学习算法无法有效控制噪声样本的影响的问题，设计该耐噪在线多分类核学习算法。该方法能够减少参与模型计算的支持向量的数量，有效控制噪声影响，显著提高模型更新效率，提高噪声数据多分类问题的分类精度，满足实际应用问题的需求。本发明专利技术耐噪在线多分类核学习算法，克服了基于批处理技术的传统分类方法无法高效处理数据流的问题，也克服了现有在线学习算法如Perceptron和Pegasos等算法无法有效抑制噪声影响的问题，可高效应用于图片的场景分类等实际应用问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种耐噪在线多分类核学习算法
本专利技术属于数据挖掘与机器学习领域，涉及数据挖掘和数据处理的方法，具体地说，涉及一种基于自适应ramp损失函数的耐噪在线多分类核学习算法。
技术介绍
多分类问题是数据挖掘与机器学习领域研究的经典问题。传统的批处理多分类方法先收集数据，基于一批数据构建学习模型，并选择优化算法得到多分类器。伴随电子商务、社交媒体、移动互联网、物联网等技术的快速发展，越来越多的实际问题所处理的数据具有数据流特性。传统批处理多分类方法在处理大规模流数据场景时存在计算复杂度高、模型更新效率低等诸多不足。在线学习算法通过动态更新模型，逐点学习样本信息，具有计算复杂度低、模型更新效率高、实时性强等优势，在处理和分析数据流问题时有优异的表现。此外，大规模标签数据中，由于人工标记的失误与数据固有的多标签特性，难免有部分错误标签，而这些错误标签会严重影响多分类器的分类效果。因此，亟需设计一种具有耐噪特性的在线多分类算法。
技术实现思路
本专利技术的目的在于针对现有基于批处理技术的多分类方法无法高效处理数据流多分类问题，而在线学习算法无法有效控制噪声样本的影响，提出了一种基于自适应ramp损失函数的耐噪在线多分类核学习算法。该方法能够减少参与模型计算的支持向量的数量，有效控制噪声影响，显著提高模型更新效率，提高噪声数据多分类问题的分类精度，满足实际应用问题的需求。根据本专利技术一实施例，提供了一种基于自适应ramp损失函数的耐噪在线多分类核学习算法，含有以下步骤：(一)选择合适的模型核函数并初始化多分类器决策函数；(二)采集数据流，利用当前多分类决策函数f(t-1)...

【技术保护点】
1.一种耐噪在线多分类核学习算法，其特征在于含有以下步骤：(一)选择合适的模型核函数并初始化多分类器决策函数；(二)以one‑by‑one的形式采集数据流，利用当前多分类决策函数f

【技术特征摘要】
1.一种耐噪在线多分类核学习算法，其特征在于含有以下步骤：(一)选择合适的模型核函数并初始化多分类器决策函数；(二)以one-by-one的形式采集数据流，利用当前多分类决策函数f(t-1)预测样本xt的标签(三)得到样本xt的真实标签yt后，根据ramp自适应参数设置策略计算该样本点的ramp损失函数的自适应参数s；(四)计算该样本xt的自适应ramp损失；(五)根据样本的自适应ramp损失，更新分类器决策函数。2.根据权利要求1所述的一种耐噪在线多分类核学习算法，其特征在于，在步骤(一)中，具体方法为：根据具体应用场景选择合适的核函数，并初始化多分类问题决策函数f(0)＝0。3.根据权利要求1所述的一种耐噪在线多分类核学习算法，其特征在于：步骤(二)中，利用多分类决策函数预测数据流样本类别标签的具体步骤为：以one-by-one的形式采集数据流，利用决策函数f(t-1)预测样本xt的标签4.根据权利要求1所述的一种耐噪在线多分类核学习算法，其特征在于，在步骤(三)中，计算样本的ramp损失函数的自适应参数s的具体方法为：根据以下ramp自适应参数设置策略计算得到参数s。5.根据权利要求1所述的...

【专利技术属性】
技术研发人员：宋允全，高富豪，雷鹤杰，梁锡军，渐令，
申请(专利权)人：中国石油大学华东，
类型：发明
国别省市：山东,37

全部详细技术资料下载我是这个专利的主人