当前位置: 首页 > 专利查询>宁波大学专利>正文

基于模糊型弱分类器的AdaBoost分类方法技术

技术编号:24252250 阅读:41 留言:0更新日期:2020-05-22 23:56
本发明专利技术公开了一种基于模糊型弱分类器的AdaBoost分类方法,其通过提取多幅图像中的所有LBP特征构建一个训练样本,并给定训练样本对应的样本分类标签矩阵;利用模糊推理对弱分类器进行寻优以获取最佳模糊型弱分类器;通过计算最佳模糊型弱分类器的权重,加权到最佳模糊型弱分类器构成强分类器;当构成的强分类器中的每个分类标记与样本分类标签矩阵中的每个分类标签对应相同时,确定构成的强分类器为最佳强分类器,反之通过计算寻找下一个最佳模糊型弱分类器时的权值向量,再迭代寻优;优点是其在面对复杂的数据集的情况下仍具有很好的分类效果,在有噪声干扰的条件下具有更好的抗噪能力。

AdaBoost classification method based on fuzzy weak classifier

【技术实现步骤摘要】
基于模糊型弱分类器的AdaBoost分类方法
本专利技术涉及一种AdaBoost分类技术,尤其是涉及一种基于模糊型弱分类器的AdaBoost分类方法。
技术介绍
近年来,人工智能技术发展日益成熟,人脸检测问题是其中的一个研究热点,在几十年的研究过程中,许多研究者提出了有效的人脸检测方法。在众多的人脸检测方法中,AdaBoost以其较高的检测速度已成为应用最广泛的方法。AdaBoost由Freund率先提出,是众多Boosting变形中最流行的一种,其核心思想是训练大量分类能力较弱的弱分类器,其中每个弱分类器的输出值限定在{-1,+1},通过加权组合的方式构造出分类能力较强的强分类器。然而,AdaBoost分类算法存在面对复杂样本集时训练复杂度高、分类精度不够,面对具有噪声的训练集时抗噪能力差等问题。针对上述问题对经典的AdaBoost分类算法进行改进,提出了RealAdaBoost、GentleAdaBoost和LogitBoost。RealAdaBoost由Schapire提出,将经典的AdaBoost处理离散二值判定规则推广到处理具有连续置信度输出的弱分类器,即值域为实数域,从而能够更精确地刻画分类边界。GentleAdaBoost则改动了迭代过程中错误样本权重的调整方法,较少的强调难以分类的样本,提高了分类器的泛化能力。LogitBoost由Frieman等提出,采用负对数似然损失函数,由于LogitBoost非常关注错判样本,因此使其能够发现离群值或是错误信息的样本,但在数据集缺失较多或是数据误差较大的情况下,预测效果并不好。上述这些改进算法相较于经典的AdaBoost分类算法在分类精度上面有所提升,但是在抗噪性能方面还存在一定问题。
技术实现思路
本专利技术所要解决的技术问题是提供一种基于模糊型弱分类器的AdaBoost分类方法,其在面对复杂的数据集的情况下仍具有很好的分类效果,在有噪声干扰的条件下具有更好的抗噪能力。本专利技术解决上述技术问题所采用的技术方案为:一种基于模糊型弱分类器的AdaBoost分类方法,其特征在于包括以下步骤:步骤1:选取一个包含N幅图像的图像集;然后提取图像集中的每幅图像中的所有LBP特征,每幅图像有M个LBP特征,图像集中的所有图像中相同位置的LBP特征为同一类LBP特征;接着以同一类LBP特征作为训练样本中的一个特征,以同一类LBP特征中的N个LBP特征作为训练样本中的一个特征中的N个特征值构建一个训练样本,以矩阵形式记为Y,其中,Y的维数为N×M,Y中的每列为一个特征,Y中的每列中的每个元素的值为一个特征值,M为正整数,M表示图像集中的每幅图像中的LBP特征的总个数,也即表示Y中包含的特征的总个数,M>1,m为正整数,m的初始值为1,1≤m≤M,N为正整数,N表示图像集中包含的图像的总幅数,也即表示Y中的每个特征中包含的特征值的总个数,N>1,n为正整数,n的初始值为1,1≤n≤N,y1,1、yn,1、yN,1对应表示Y中的第1个特征中的第1个特征值、第n个特征值、第N个特征值,y1,m、yn,m、yN,m对应表示Y中的第m个特征中的第1个特征值、第n个特征值、第N个特征值,y1,M、yn,M、yN,M对应表示Y中的第M个特征中的第1个特征值、第n个特征值、第N个特征值;并给定Y对应的样本分类标签矩阵,记为G,G=(g1…gn…gN)T;其中,G的维数为N×1,()T表示向量或矩阵的转置,g1表示Y中的第1行特征值(y1,1…y1,m…y1,M)对应的分类标签,gn表示Y中的第n行特征值(yn,1…yn,m…yn,M)对应的分类标签,gN表示Y中的第N行特征值(yN,1…yN,m…yN,M)对应的分类标签,g1、gn和gN的取值为1或-1;令k表示该AdaBoost分类方法中构成最佳强分类器的最佳模糊型弱分类器的个数,k为正整数,k的初始值为1;步骤2:利用模糊推理对弱分类器进行寻优以获取第k个最佳模糊型弱分类器,其中,获取第k个最佳模糊型弱分类器的具体过程为:步骤2_1:选取Y中的第j个特征,即(y1,j…yn,j…yN,j)T;然后提取出Y中的第j个特征中的最小特征值和最大特征值,对应记为Zmin,j和Zmax,j;其中,j为正整数,j的初始值为1,j∈[1,M],y1,j、yn,j、yN,j对应表示Y中的第j个特征中的第1个特征值、第n个特征值、第N个特征值;步骤2_2:制定模糊规则:将区间[Zmin,j,Zmax,j]平均分成num个子区间,共有num-1个子区间划分点,所有子区间的宽度即相邻两个子区间划分点之间的间距均为Wj,然后将每个子区间划分点作为中心,生成每个子区间划分点对应的5个具有不同带宽的高斯函数,将第q个子区间划分点对应的第b个高斯函数记为共得到5×(num-1)个高斯函数;再将每个高斯函数定义为一条模糊规则,共有5×(num-1)条模糊规则;其中,num为正整数,num∈[2,50],q为正整数,q的初始值为1,1≤q≤num-1,b为正整数,b的初始值为1,b=1,2,3,4,5,e为自然基数,x为高斯函数中的自变量,取值为全体实数,cq表示第q个子区间划分点对应的5个具有不同带宽的高斯函数的中心,即为第q个子区间划分点,cq=Zmin,j+q×Wj,ub表示的带宽,u1=0.2,u2=0.4,u3=0.6,u4=0.8,u5=1;步骤2_3:从5×(num-1)条模糊规则中选取第r条模糊规则,记为然后对Y中的第j个特征中的每个特征值进行高斯模糊化处理,得到Y中的第j个特征中的每个特征值对应的高斯函数,将Y中的第j个特征中的第t个特征值yt,j对应的高斯函数记为Φt,j,再计算与Y中的第j个特征中的每个特征值的适配度,将与yt,j的适配度记为ωr,t,j,ωr,t,j的获取过程为:确定与Φt,j之间有无相交点,若两者之间无相交点,则令ωr,t,j=0;若两者之间有一个相交点,则通过计算得到自变量的值,从几何角度看,自变量的值即为相交点的横坐标,把自变量的值代入到或Φt,j中得到函数值,将函数值赋值给ωr,t,j;若两者之间有两个相交点,则通过计算得到自变量的两个值,从几何角度看,自变量的两个值即为两个相交点的横坐标,把自变量的两个值代入到或Φt,j中得到对应的函数值,将两个函数值中的最大值赋值给ωr,t,j;之后将与Y中的第j个特征中的所有特征值的适配度构成模糊规则下Y中的第j个特征的适配度向量,记为ωr,j,ωr,j=(ωr,1,j…ωr,t,j…ωr,N,j)T;其中,r为正整数,r的初始值为1,1≤r≤5×(num-1),t为正整数,t的初始值为1,1≤t≤N,U表示对Y中的第j个特征中的每个特征值进行高斯模糊化处理的带宽,U=1,ωr,1,j表示与Y中的第j个特征中的第1个特征值y1,j的适配度,ωr,N,j表示与Y中的第j个特征中的第N个特征值yN,j的适配度;步骤2_4:令r=r+1,然后返回步骤2_3继续执行,直至5×(num-1)条模糊规则均处理完毕,得到每条模糊规则本文档来自技高网
...

【技术保护点】
1.一种基于模糊型弱分类器的AdaBoost分类方法,其特征在于包括以下步骤:/n步骤1:选取一个包含N幅图像的图像集;然后提取图像集中的每幅图像中的所有LBP特征,每幅图像有M个LBP特征,图像集中的所有图像中相同位置的LBP特征为同一类LBP特征;接着以同一类LBP特征作为训练样本中的一个特征,以同一类LBP特征中的N个LBP特征作为训练样本中的一个特征中的N个特征值构建一个训练样本,以矩阵形式记为Y,

【技术特征摘要】
1.一种基于模糊型弱分类器的AdaBoost分类方法,其特征在于包括以下步骤:
步骤1:选取一个包含N幅图像的图像集;然后提取图像集中的每幅图像中的所有LBP特征,每幅图像有M个LBP特征,图像集中的所有图像中相同位置的LBP特征为同一类LBP特征;接着以同一类LBP特征作为训练样本中的一个特征,以同一类LBP特征中的N个LBP特征作为训练样本中的一个特征中的N个特征值构建一个训练样本,以矩阵形式记为Y,其中,Y的维数为N×M,Y中的每列为一个特征,Y中的每列中的每个元素的值为一个特征值,M为正整数,M表示图像集中的每幅图像中的LBP特征的总个数,也即表示Y中包含的特征的总个数,M>1,m为正整数,m的初始值为1,1≤m≤M,N为正整数,N表示图像集中包含的图像的总幅数,也即表示Y中的每个特征中包含的特征值的总个数,N>1,n为正整数,n的初始值为1,1≤n≤N,y1,1、yn,1、yN,1对应表示Y中的第1个特征中的第1个特征值、第n个特征值、第N个特征值,y1,m、yn,m、yN,m对应表示Y中的第m个特征中的第1个特征值、第n个特征值、第N个特征值,y1,M、yn,M、yN,M对应表示Y中的第M个特征中的第1个特征值、第n个特征值、第N个特征值;
并给定Y对应的样本分类标签矩阵,记为G,G=(g1…gn…gN)T;其中,G的维数为N×1,()T表示向量或矩阵的转置,g1表示Y中的第1行特征值(y1,1…y1,m…y1,M)对应的分类标签,gn表示Y中的第n行特征值(yn,1…yn,m…yn,M)对应的分类标签,gN表示Y中的第N行特征值(yN,1…yN,m…yN,M)对应的分类标签,g1、gn和gN的取值为1或-1;
令k表示该AdaBoost分类方法中构成最佳强分类器的最佳模糊型弱分类器的个数,k为正整数,k的初始值为1;
步骤2:利用模糊推理对弱分类器进行寻优以获取第k个最佳模糊型弱分类器,其中,获取第k个最佳模糊型弱分类器的具体过程为:
步骤2_1:选取Y中的第j个特征,即(y1,j…yn,j…yN,j)T;然后提取出Y中的第j个特征中的最小特征值和最大特征值,对应记为Zmin,j和Zmax,j;其中,j为正整数,j的初始值为1,j∈[1,M],y1,j、yn,j、yN,j对应表示Y中的第j个特征中的第1个特征值、第n个特征值、第N个特征值;
步骤2_2:制定模糊规则:将区间[Zmin,j,Zmax,j]平均分成num个子区间,共有num-1个子区间划分点,所有子区间的宽度即相邻两个子区间划分点之间的间距均为Wj,然后将每个子区间划分点作为中心,生成每个子区间划分点对应的5个具有不同带宽的高斯函数,将第q个子区间划分点对应的第b个高斯函数记为共得到5×(num-1)个高斯函数;再将每个高斯函数定义为一条模糊规则,共有5×(num-1)条模糊规则;其中,num为正整数,num∈[2,50],q为正整数,q的初始值为1,1≤q≤num-1,b为正整数,b的初始值为1,b=1,2,3,4,5,e为自然基数,x为高斯函数中的自变量,取值为全体实数,cq表示第q个子区间划分点对应的5个具有不同带宽的高斯函数的中心,即为第q个子区间划分点,cq=Zmin,j+q×Wj,ub表示的带宽,u1=0.2,u2=0.4,u3=0.6,u4=0.8,u5=1;
步骤2_3:从5×(num-1)条模糊规则中选取第r条模糊规则,记为然后对Y中的第j个特征中的每个特征值进行高斯模糊化处理,得到Y中的第j个特征中的每个特征值对应的高斯函数,将Y中的第j个特征中的第t个特征值yt,j对应的高斯函数记为Φt,j,再计算与Y中的第j个特征中的每个特征值的适配度,将与yt,j的适配度记为ωr,t,j,ωr,t,j的获取过程为:确定与Φt,j之间有无相交点,若两者之间无相交点,则令ωr,t,j=0;若两者之间有一个相交点,则通过计算得到自变量的值,从几何角度看,自变量的值即为相交点的横坐标,把自变量的值代入到或Φt,j中得到函数值,将函数值赋值给ωr,t,j;若两者之间有两个相交点,则通过计算得到自变量的两个值,从几何角度看,自变量的两个值即为两个相交点的横坐标,把自变量的两个值代入到或Φt,j中得到对应的函数值,将两个函数值中的最大值赋值给ωr,t,j;之后将与Y中的第j个特征中的所有特征值的适配度...

【专利技术属性】
技术研发人员:张梦娇叶庆卫
申请(专利权)人:宁波大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1