一种基于随机蕨分类器的半自主在线学习方法技术

技术编号:10468010 阅读:197 留言:0更新日期:2014-09-24 19:28
本发明专利技术提供基于随机蕨分类器的半自主在线学习方法,包括以下步骤:1)准备初始训练分类器的样本集;2)随机蕨分类器初始训练;3)获得在线学习样本;4)随机蕨分类器的在线训练。本发明专利技术提出了随机蕨分类器的在线学习算法使目标检测系统能够逐步提高其性能,最终达到检测精度要求;此外,通过人工判断获取在线学习样本的方法保证了在线学习样本类别标注的正确性;相对于传统的分类器训练方法,本发明专利技术不需要事先准备大量的正负训练样本,减轻了人工标注的工作量,并可验证随机蕨分类器的分类性能。

【技术实现步骤摘要】
-种基于随机蕨分类器的半自主在线学习方法
[〇〇〇1] 本专利技术属于模式识别方法,具体涉及一种通过在线学习算法训练分类器,以提高 分类器性能的方法。
技术介绍
在线学习属于增量学习的研究范畴,在这一类方法中分类器对每个样本只学一 次,而不是重复的学习,这样在线学习算法运行过程中不需要大量的存储空间来存储训练 样本,分类器每获得一个样本,即对其进行在线学习,通过在线学习使分类器在使用过程中 仍然能根据新样本自我更新和改进,进一步提高分类效果。 早期的在线学习算法有Winnow算法,统一线性预测算法等,2001年学者Oza将 这些算法与boosting算法进行结合,提出了在线boosting算法(该算法引自Online bagging and boosting^N. Oza and S. Russell, In Proc. Artificial Intelligence and Statistics,105-112, 2001),在Oza的方法中,强分类器是一定数量的弱分类器的加权和, 这些弱分类器都是从弱分类器集合中挑选出来的。在线学习时,每个训练样本逐一的更新 弱分类器集合中的每个弱分类器,包括调整正负样本的分类阈值以及该分类器的权重,使 好的弱分类器权重越来越高,而较差的弱分类器权重越来越低,从而每次在线学习一个样 本就可以挑选出一个当前权重最高的弱分类器加入强分类器中使最终训练出来的分类器 有较强的分类能力。但是,在线boosting算法的弱分类器集合中每个弱分类器都要对新 样本进行在线学习,当弱分类器个数较多时,在线学习速度必然会变慢。Grabner对在线 boosting算法进行了改进,使其也象Adaboost算法一样可以进行特征选择,并且这种特 征选择以及对分类器的更新都是在线进行的,称为在线Adaboost (该算法引自On-line boosting and visionΗ· Grabner and Η· Bischof, In Proc. CVPR, (1) :260-267, 2006)。但 是在线Adaboost用特征选择算子代替一般的弱分类器合成强分类器,特征选择算子数以 及特征选择算子对应的弱分类器数都是固定的,相应的在线学习分类器结构比较僵化。当 发现其分类能力无法满足检测性能的要求时,即使持续的在线学习下去也无法提高检测精 度。
技术实现思路
本专利技术要解决的技术问题是:提供一种基于随机蕨分类器的半自主在线学习方 法,能够提高分类性能。 本专利技术为解决上述技术问题所采取的技术方案为:一种基于随机蕨分类器的半自 主在线学习方法,其特征在于:它包括以下步骤: 1)准备初始训练分类器的样本集: 针对待检测目标类,在视频图像的第一帧中框选出一个目标,对该目标图片进行 仿射变换得到的图片作为正样本;以不含有目标的背景图像区域作为负样本;如此随机的 获取一定数量的正样本和负样本作为初始训练分类器的样本集; 2)随机蕨分类器初始训练: 使用准备好的初始训练分类器的样本集对随机蕨分类器进行初始训练,初始训练 好的随机蕨分类器即为当前目标检测器,遍历待检测的视频图像进行目标检测;[〇〇1〇] 3)获得在线学习样本: 对于步骤2)中得到的检测后的视频图像,采用人工判断其检测结果的正确性,对 于正确的检测结果人工标注为正样本,否则为负样本,对漏检的视频图像标注为正样本;判 断后的正负样本为在线学习样本; 4)随机蕨分类器的在线训练: 使用步骤3)获得的正负样本对随机蕨分类器进行在线学习,逐渐提高其分类精 度。 按上述方法,步骤2)的具体方法如下: 2.1)构造随机蕨:[〇〇16] 对样本集中的单个样本上随机取s对特征点作为一组随机蕨,每个样本取特征点 的位置相同,每对特征点进行像素值的比较,每对特征点中前一个特征点像素值大则取特 征值为1,反之则取特征值为〇, S对特征点比较后得到的S个特征值按照随机的顺序构成 一个S位的二进制数,即为该组随机蕨的随机蕨数值,每个样本的随机蕨中特征值的顺序 一致; 2. 2)计算随机蕨数值在正负样本类上的后验概率: 随机蕨中,有一部分为正样本得到的,其它为负样本得到的;随机蕨数值的取值种 类有2S个; 统计每种随机蕨数值的取值的正样本个数,从而获得随机蕨数值在正样本类q上 的后验概率分布PFilCi);同理获得随机蕨数值在负样本类Q上的后验概率分布PFilQ); 联合所有随机蕨对初始训练分类器的样本集进行分类,即为随机蕨分类器; 2. 3)采用随机蕨分类器在每帧视频图像中进行目标检测: 遍历待检测的每帧视频图像,在每帧视频图像中提取相同大小的图像块作为待测 样本,待测样本的大小与步骤1)中正样本的大小相等,计算每个待测样本的随机蕨数值, 从而得到相应的后验概率,最后由随机蕨分类器计算其类别; 对于类别为正样本的图像块,则作为目标被检测出来。 按上述方法,步骤4)随机蕨分类器的在线学习通过更新后验概率分布实现。 按上述方法,步骤4)的具体方法如下: 4. 1)将步骤3)获得的正负样本作为在线学习样本;设一个在线学习样本为(fnew, ck),其中为随机蕨s位的二进制数,ck为样本类别,计算该在线学习样本的随机蕨数 值; 4. 2)对步骤2. 1)样本集中类别为ck的样本总数加1,类别为ck的与该在线学习 样本的随机蕨数值相同的样本数加1;其它随机蕨数值的样本数不变; 4. 3)根据更新后的样本数,重新计算随机蕨数值在该样本类上的后验概率分布; 4. 4)每新增一个在线学习样本,便重复4. 1)至4. 3)对后验概率分布进行更新一 次。 -种利用上述基于随机蕨分类器的半自主在线学习方法实现的目标检测方法,其 特征在于:当基于随机蕨分类器的半自主在线学习方法的步骤3)人工判断其结果为全部 正确时,采用随机蕨分类器对目标进行检测。 本专利技术的有益效果为:本专利技术提出了随机蕨分类器的在线学习算法使目标检测系 统能够逐步提高其性能,最终达到检测精度要求;此外,通过人工判断获取在线学习样本的 方法保证了在线学习样本类别标注的正确性;相对于传统的分类器训练方法,本专利技术不需 要事先准备大量的正负训练样本,减轻了人工标注的工作量,并可验证随机蕨分类器的分 类性能。 【附图说明】 图1为本专利技术一实施例的流程框图。 图2为分层描述的随机蕨分类器在线训练结构图。 图3为两组实验数据的效果图,图3(a)为初始训练分类器对目标检测的效果图, 图3(b)为训练了一定时间后的随机蕨分类器对目标检测的效果图。 图4为不同背景下对目标检测的效果图。 图5为不同类型目标下对目标检测的效果图。 【具体实施方式】 下面结合具体实例和附图对本专利技术做进一步说明。 图1为本专利技术一实施例的流程框图,包括以下步骤: 1)准备初始训练分类器的样本集: 针对待检测目标类,在视频图像的第一帧中框选出一个目标,对该目标图片进行 仿射变换得到的图片作为正样本;以不含有目标的背景图像区域作为负样本;如此随机的 获取一定数量的正样本和负样本作为初始训练分类器的样本集。 所述的样本集中的样本在本实施例中就是相同大小的图像块,一般尺寸为 15 X 15 (像素),若图像块中含有待检测的目标则该样本为正样本,没有本文档来自技高网
...
一种基于随机蕨分类器的半自主在线学习方法

【技术保护点】
一种基于随机蕨分类器的半自主在线学习方法,其特征在于:它包括以下步骤:1)准备初始训练分类器的样本集:针对待检测目标类,在视频图像的第一帧中框选出一个目标,对该目标图片进行仿射变换得到的图片作为正样本;以不含有目标的背景图像区域作为负样本;如此随机的获取一定数量的正样本和负样本作为初始训练分类器的样本集;2)随机蕨分类器初始训练:使用准备好的初始训练分类器的样本集对随机蕨分类器进行初始训练,初始训练好的随机蕨分类器即为当前目标检测器,遍历待检测的视频图像进行目标检测;3)获得在线学习样本:对于步骤2)中得到的检测后的视频图像,采用人工判断其检测结果的正确性,对于正确的检测结果人工标注为正样本,否则为负样本,对漏检的视频图像标注为正样本;判断后的正负样本为在线学习样本;4)随机蕨分类器的在线训练:使用步骤3)获得的正负样本对随机蕨分类器进行在线学习,逐渐提高其分类精度。

【技术特征摘要】
1. 一种基于随机蕨分类器的半自主在线学习方法,其特征在于:它包括以下步骤: 1) 准备初始训练分类器的样本集: 针对待检测目标类,在视频图像的第一帧中框选出一个目标,对该目标图片进行仿射 变换得到的图片作为正样本;以不含有目标的背景图像区域作为负样本;如此随机的获取 一定数量的正样本和负样本作为初始训练分类器的样本集; 2) 随机蕨分类器初始训练: 使用准备好的初始训练分类器的样本集对随机蕨分类器进行初始训练,初始训练好的 随机蕨分类器即为当前目标检测器,遍历待检测的视频图像进行目标检测; 3) 获得在线学习样本: 对于步骤2)中得到的检测后的视频图像,采用人工判断其检测结果的正确性,对于正 确的检测结果人工标注为正样本,否则为负样本,对漏检的视频图像标注为正样本;判断后 的正负样本为在线学习样本; 4) 随机蕨分类器的在线训练: 使用步骤3)获得的正负样本对随机蕨分类器进行在线学习,逐渐提高其分类精度。2. 根据权利要求1所述的基于随机蕨分类器的半自主在线学习方法,其特征在于:步 骤2)的具体方法如下: 2. 1)构造随机蕨: 对样本集中的单个样本上随机取s对特征点作为一组随机蕨,每个样本取特征点的位 置相同,每对特征点进行像素值的比较,每对特征点中前一个特征点像素值大则取特征值 为1,反之则取特征值为0, s对特征点比较后得到的s个特征值按照随机的顺序构成一个s 位的二进制数,即为该组随机蕨的随机蕨数值,每个样本的随机蕨中特征值的顺序一致; 2. 2)计算随机蕨数值在正负样本类上的后验概率: 随机蕨中,有一部分为正样本得到的,其它为负样本得到的;随机蕨数值的取值种类有 2s个; 统计每种随机蕨数值的取值的正样本个数,从而...

【专利技术属性】
技术研发人员:罗大鹏韩家宝魏龙生王勇马丽
申请(专利权)人:中国地质大学武汉
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1