当前位置: 首页 > 专利查询>文益民专利>正文

一种数据流分类的概念漂移检测方法技术

技术编号:4006122 阅读:285 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种数据流分类的概念漂移检测方法,其步骤为:①数据流分块:根据事先设定的数据块的规模d,按照数据到达的先后顺序每采集到d个训练样本就训练一个分类器。②滑动窗口调整:设定滑动窗口中分类器hi的数量K,当滑动窗口中分类器hi的数量少于K时,最新训练的分类器hi自动加入滑动窗口;当滑动窗口中分类器hi的数量等于K时,对滑动窗口中的分类器hi进行更新;③概念漂移检测:当需要进行概念检测时,使用可信多数投票法从滑动窗口中选择合适的分类器给出概念判别。本发明专利技术是一种原理简单、运行可靠、检测精度高、检测速度快、适用范围广的数据流分类的概念漂移检测方法。

【技术实现步骤摘要】

【技术保护点】
一种数据流分类的概念漂移检测方法,其特征在于步骤为:①数据流分块:设定数据块的规模d,按照数据流中数据到达的先后顺序,每采集到d个数据,就给出这d个数据的类别并以该d个数据所组成的数据块为一个训练集,将所采集到的数据块依顺序记为S↓[i],其中0≤i且i的最大值由当前训练样本的总数量决定,第一个数据块记为S↓[0];在每个S↓[i]上训练一个分类器h↓[i],以S↓[i]作为测试集由h↓[i]给出测试结果TR↓[i],存储S↓[i]、h↓[i]和TR↓[i];②滑动窗口调整:设定滑动窗口中分类器h↓[i]的数量K,当滑动窗口中分类器h↓[i]的数量少于K时,最新训练的分类器h↓[i]自动加入滑动窗口;当滑动窗口中分类器h↓[i]的数量等于K时,对滑动窗口中的分类器h↓[i]进行更新;③概念漂移检测:设当前滑动窗口中分类器h↓[i]的数量为K↓[0],K↓[0]≤K,当需要对测试数据X进行概念漂移检测时分两步进行:3.1、将测试数据X输入滑动窗口中的所有分类器h↓[i],按顺序计算由分类器h↓[0],h↓[1],…,h↓[K↓[0]-1]给出的分类结果和分类置信度,3.2、自动选择滑动窗口中分类置信度较高的分类器进行多数投票,给出对测试数据X的类别判断,完成对概念漂移的检测。...

【技术特征摘要】

【专利技术属性】
技术研发人员:文益民
申请(专利权)人:文益民
类型:发明
国别省市:43[中国|湖南]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1