一种基于随机蕨分类器的半自主在线学习方法技术

技术编号：10468010 阅读：197 留言：0更新日期：2014-09-24 19:28

本发明专利技术提供基于随机蕨分类器的半自主在线学习方法，包括以下步骤：1)准备初始训练分类器的样本集；2)随机蕨分类器初始训练；3)获得在线学习样本；4)随机蕨分类器的在线训练。本发明专利技术提出了随机蕨分类器的在线学习算法使目标检测系统能够逐步提高其性能，最终达到检测精度要求；此外，通过人工判断获取在线学习样本的方法保证了在线学习样本类别标注的正确性；相对于传统的分类器训练方法，本发明专利技术不需要事先准备大量的正负训练样本，减轻了人工标注的工作量，并可验证随机蕨分类器的分类性能。

全部详细技术资料下载

【技术实现步骤摘要】
-种基于随机蕨分类器的半自主在线学习方法
[〇〇〇1] 本专利技术属于模式识别方法，具体涉及一种通过在线学习算法训练分类器，以提高分类器性能的方法。
技术介绍
在线学习属于增量学习的研究范畴，在这一类方法中分类器对每个样本只学一次，而不是重复的学习，这样在线学习算法运行过程中不需要大量的存储空间来存储训练样本，分类器每获得一个样本，即对其进行在线学习，通过在线学习使分类器在使用过程中仍然能根据新样本自我更新和改进，进一步提高分类效果。早期的在线学习算法有Winnow算法，统一线性预测算法等，2001年学者Oza将这些算法与boosting算法进行结合，提出了在线boosting算法（该算法引自Online bagging and boosting^N. Oza and S. Russell, In Proc. Artificial Intelligence and Statistics，105-112, 2001)，在Oza的方法中，强分类器是一定数量的弱分类器的加权和，这些弱分类器都是从弱分类器集合中挑选出来的。在线学习时，每个训练样本逐一的更新弱分类器集合中的每个弱分类器，包括调整正负样本的分类阈值以及该分类器的权重，使好的弱分类器权重越来越高，而较差的弱分类器权重越来越低，从而每次在线学习一个样本就可以挑选出一个当前权重最高的弱分类器加入强分类器中使最终训练出来的分类器有较强的分类能力。但是，在线boosting算法的弱分类器集合中每个弱分类器都要对新样本进行在线学习，当弱分类器个数较多时，在线学习速度必然会变慢...
一种基于随机蕨分类器的半自主在线学习方法

【技术保护点】
一种基于随机蕨分类器的半自主在线学习方法，其特征在于：它包括以下步骤：1)准备初始训练分类器的样本集：针对待检测目标类，在视频图像的第一帧中框选出一个目标，对该目标图片进行仿射变换得到的图片作为正样本；以不含有目标的背景图像区域作为负样本；如此随机的获取一定数量的正样本和负样本作为初始训练分类器的样本集；2)随机蕨分类器初始训练：使用准备好的初始训练分类器的样本集对随机蕨分类器进行初始训练，初始训练好的随机蕨分类器即为当前目标检测器，遍历待检测的视频图像进行目标检测；3)获得在线学习样本：对于步骤2)中得到的检测后的视频图像，采用人工判断其检测结果的正确性，对于正确的检测结果人工标注为正样本，否则为负样本，对漏检的视频图像标注为正样本；判断后的正负样本为在线学习样本；4)随机蕨分类器的在线训练：使用步骤3)获得的正负样本对随机蕨分类器进行在线学习，逐渐提高其分类精度。

【技术特征摘要】
1. 一种基于随机蕨分类器的半自主在线学习方法，其特征在于：它包括以下步骤： 1) 准备初始训练分类器的样本集：针对待检测目标类，在视频图像的第一帧中框选出一个目标，对该目标图片进行仿射变换得到的图片作为正样本；以不含有目标的背景图像区域作为负样本；如此随机的获取一定数量的正样本和负样本作为初始训练分类器的样本集； 2) 随机蕨分类器初始训练：使用准备好的初始训练分类器的样本集对随机蕨分类器进行初始训练，初始训练好的随机蕨分类器即为当前目标检测器，遍历待检测的视频图像进行目标检测； 3) 获得在线学习样本：对于步骤2)中得到的检测后的视频图像，采用人工判断其检测结果的正确性，对于正确的检测结果人工标注为正样本，否则为负样本，对漏检的视频图像标注为正样本；判断后的正负样本为在线学习样本； 4) 随机蕨分类器的在线训练：使用步骤3)获得的正负样本对随机蕨分类器进行在线学习，逐渐提高其分类精度。2. 根据权利要求1所述的基于随机蕨分类器的半自主在线学习方法，其特征在于：步骤2)的具体方法如下： 2. 1)构造随机蕨：对样本集中的单个样本上随机取s对特征点作为一组随机蕨，每个样本取特征点的位置相同，每对特征点进行像素值的比较，每对特征点中前一个特征点像素值大则取特征值为1，反之则取特征值为0, s对特征点比较后得到的s个特征值按照随机的顺序构成一个s 位的二进制数，即为该组随机蕨的随机蕨数值，每个样本的随机蕨中特征值的顺序一致； 2. 2)计算随机蕨数值在正负样本类上的后验概率：随机蕨中，有一部分为正样本得到的，其它为负样本得到的；随机蕨数值的取值种类有 2s个；统计每种随机蕨数值的取值的正样本个数，从而...

【专利技术属性】
技术研发人员：罗大鹏，韩家宝，魏龙生，王勇，马丽，
申请(专利权)人：中国地质大学武汉，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人