一种用于在线不平衡流数据的分类方法技术

技术编号:19935095 阅读:46 留言:0更新日期:2018-12-29 04:52
本发明专利技术公开了一种用于在线不平衡流数据的分类方法,包括以下步骤:步骤S1:输入参数并初始化在线分类器模型;步骤S2:将当前样本输入在线分类器模型获取预测标签值;步骤S3:获取当前样本的标签并与步骤S2中获取的预测标签值相比较,如果两者不一致,则执行步骤S4,否则,继续输入下一个样本;步骤S4:根据当前样本的标签获取代价敏感参数并利用代价敏感参数对权值进行更新。采用本发明专利技术技术方案,即解决了传统在线分类方法无解解决的不平衡流数据分类问题,同时提高了分类精度。

【技术实现步骤摘要】
一种用于在线不平衡流数据的分类方法
本专利技术涉及模式识别、机器学习
,尤其涉及一种用于在线不平衡流数据的分类方法。
技术介绍
随着信息技术的迅猛发展,尤其是互联网行业的广泛应用,越来越多的领域出现了对海量高速到达的数据实时处理需求。各个行业产生的业务数据大多数情况下可以看作动态到达的流式数据,与传统数据相比,这类数据具有动态性、无序性、无限性、突发性和体积大等特点。如何从海量的数据中挖掘有用的特征,并对每一个样本进行实时分类变得尤为重要。传统的批处理式的学习方法一方面存在学习时间长、学习效率低的问题;另一方面难以针对增量数据有效地更新模型,导致难以有效地使模型适应数据中发生的概念迁移和概念演化问题。传统的批处理模式的机器学习算法在当前大数据环境下变得越来越力不从心,而在线学习通过流式计算框架,在内存中直接对数据实时运算,为大数据的学习和分类提供了有力的工具。最早的在线学习算法可以追溯到20世纪50年代著名的感知器算法(Perceptron);近年来,研究人员提出了在线核学习算法、最小收缩和选择算子算法(LSASSO)、在线梯度下降法(OGD)、在线被动进取算法(PA)、信心加本文档来自技高网...

【技术保护点】
1.一种用于在线不平衡流数据的分类方法,其特征在于,包括以下步骤:步骤S1:输入参数并初始化在线分类器模型;步骤S2:将当前样本输入在线分类器模型获取预测标签值,其中,该模型符合高斯分布N(u,∑);步骤S3:获取当前样本的标签并与步骤S2中获取的预测标签值相比较,如果两者不一致,则执行步骤S4,否则,继续输入下一个样本;步骤S4:根据当前样本的标签获取代价敏感参数并利用代价敏感参数对权值进行更新;其中,所述步骤S4进一步包括以下步骤:步骤S41:如果样本的标签为正,则设定代价敏感参数为C+;如果样本的标签为负,则设定代价敏感参数为C‑;步骤S42:根据代价敏感参数更新高斯分布的参数,也即,根...

【技术特征摘要】
1.一种用于在线不平衡流数据的分类方法,其特征在于,包括以下步骤:步骤S1:输入参数并初始化在线分类器模型;步骤S2:将当前样本输入在线分类器模型获取预测标签值,其中,该模型符合高斯分布N(u,∑);步骤S3:获取当前样本的标签并与步骤S2中获取的预测标签值相比较,如果两者不一致,则执行步骤S4,否则,继续输入下一个样本;步骤S4:根据当前样本的标签获取代价敏感参数并利用代价敏感参数对权值进行更新;其中,所述步骤S4进一步包括以下步骤:步骤S41:如果样本的标签为正,则设定代价敏感参数为C+;如果样本的标签为负,则设定代价敏感参数为C-;步骤S42:根据代价敏感参数更新高斯分布的参数,也即,...

【专利技术属性】
技术研发人员:胡冀颜成钢彭冬亮吴建锋
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1