The present invention relates to a method for calculating the lower bound of feature scale for classification. In the classification problem, the characteristic scales of different classes are the standardization factors used to measure the distance between features and their classes; the feature scales are obtained according to the variation of the characteristics of the samples. Generally, the relatively small values are not accurate and stable, and need to be limited by the common lower bounds of the feature scales. The lower bound of each feature scale in the present invention starts from a value far less than the target, and gradually increases according to the principle of not increasing the misclassification of heterogeneous samples to this class, thus realizing the estimation of the lower bound of the feature scale according to the median of the feature scale or a certain proportion of the range length of the sample feature. This method has better classification accuracy, and does not need to adjust the parameters. The parameters are generally universal.
【技术实现步骤摘要】
一种用于分类的特征尺度下界的计算方法
本专利技术属于模式识别和机器视觉
,具体涉及一种用于分类的特征尺度下界的计算方法。
技术介绍
在分类问题中,按目标到各个类的偏离度(也可看作距离)远近来确定目标的归属是直接又简单的分类方法,但是不同的特征的量级可能是不一样的,即使同一特征对不同的类来说量级也可能不一样,所以要对每个类的每个特征建立一个特征尺度,作为比较的依据。从每个类的样本特征变化可以估算出一个特征尺度,由于样本的不确定性和随机性,对于不同的类的同一种特征,相对小的值往往不稳定,所以用一个共同的特征尺度下界来进行约束,见参考文档[1];特征尺度下界可以从样本特征的范围长度或者特征尺度的中值乘以一个系数估算,但是这不一定能得到分类效果最合适的特征尺度下界值,而且需要手动调节系数进行尝试。
技术实现思路
本专利技术的目的在于:针对参考文档中的分类器的特征尺度下界的简单估计方式的缺点,通过训练样本的方式来得到更有利于正确分类的特征尺度下界值。为实现上述目的,本专利技术采用如下技术方案:S1、输入所有样本的特征矢量和类别名,找到每一特征在所有样本上的最大值Mf和最小值mf,记下每一个特征的范围长度Rf=Mf-mf;如果Rf≤δf,设置权值wf=0,表示该特征无效,否则设置wf=1;计算特征尺度下界的上界UfRf,并初始化特征尺度下界Lf=αUfRf,其中0<α≤0.1;S2、按参考文档[1],计算每个类的样本特征中心Cb,f和样本特征尺度其中N为该子类的样本总数,X为特征值,b为子类序号,s为样本序号,p为正整数;然后得到特征尺度另外一个样本到一个类的偏离度 ...
【技术保护点】
1.一种用于分类的特征尺度下界的计算方法,其特征在于:S1、输入所有样本的特征矢量和类别名,找到每一特征在所有样本上的最大值Mf和最小值mf,记下每一个特征的范围长度Rf=Mf‑mf;如果Rf≤δf,设置权值wf=0,表示该特征无效,否则设置wf=1;计算特征尺度下界的上界UfRf,并初始化特征尺度下界Lf=αUfRf,其中0<α≤0.1;S2、按参考文档[1],计算每个类的样本特征中心Cb,f和样本特征尺度
【技术特征摘要】
1.一种用于分类的特征尺度下界的计算方法,其特征在于:S1、输入所有样本的特征矢量和类别名,找到每一特征在所有样本上的最大值Mf和最小值mf,记下每一个特征的范围长度Rf=Mf-mf;如果Rf≤δf,设置权值wf=0,表示该特征无效,否则设置wf=1;计算特征尺度下界的上界UfRf,并初始化特征尺度下界Lf=αUfRf,其中0<α≤0.1;S2、按参考文档[1],计算每个类的样本特征中心Cb,f和样本特征尺度其中N为该子类的样本总数,X为特征值,b为子类序号,s为样本序号,p为正整数;然后得到特征尺度另外一个样本到一个类的偏离度的计算公式:其中X为特征矢量,Xf为序号为f的特征值,也即X的第f个分量,F为特征总数;S3、对每一个类别,收集一些非本类的邻近样本做成Class-Sample对(简称CS对)放到待检测的序列Pairs中,一个CS对中含有一个类别指针和一个样本指针;加入Pa...
【专利技术属性】
技术研发人员:朱杰英,卢盛林,
申请(专利权)人:广东奥普特科技股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。