一种对特征描述方法进行衡量的方法技术

技术编号:12134360 阅读:60 留言:0更新日期:2015-09-30 15:07
本发明专利技术涉及图像识别领域中的物体探测和识别领域,尤其是涉及一种对特征描述方法进行衡量的方法。本发明专利技术针对现有技术存在的问题,提供一种对特征描述方法进行衡量的方法,对多种特征描述方法进行定量比较,从而选择最佳的特征描述方法。本发明专利技术通过对待识别物体正负样本采样,并使用待衡量特征描述方法转换正负采样为正负特征描述向量,然后通过聚类分析方法对正-正特征描述向量的可重复性,以及正-负特征向量的可区分性进行量化计算,从而定量评估待衡量特征描述方法对待识别物体进行探测和识别的性能。

【技术实现步骤摘要】

本专利技术设及图像识别领域中的物体探测和识别领域,尤其是设及一种对特征描述 方法进行衡量的方法。
技术介绍
在物体图像探测及识别领域,当前的研究热点是类属物体(Generic化ject Category)探测及识别。类属物体指一类物体,同类物体中的个体之间存在着共性,也存在 着个性,比如飞机、苹果和人。类属物体是针对特定物体而言的。特定物体是指某个特殊的 个体,或者具有完全相同外表的一个群体,比如艾菲尔铁塔、我的自行车、崭新的iphoneS。 相比特定物体探测。 类属物体探测和识别的难度比特定物体明显增大。首先,一类物体包含的个体数 量可能是无穷的,不可能用所有的样本来训练探测器,只能选取部分有代表性的个体。第 二,同类物体具有共同的相似性,但是该些相似性可能很抽象,比如光滑、圆鼓鼓、金属质感 等。最后,同类物体中的不同个体,往往会在外观上呈现差异性,如何界定一类物体可W包 含的差异变化范围,W及如何根据该些差异进一步进行子类划分,也是一个难点。 类属物体探测器的设计基本都是从特征描述方法的设计或者选择开始。一般在探 测器训练阶段,首先将在训练图像中采样的窗口使用特征描述方法转换为特征向量,之后 再采用多种机器学习方法训练高上层识别模型及参数。在探测与识别阶段,首先将探测窗 口使用特征描述方法转换为特征向量,再筛选组合与被探测物体相似度高的特征向量,实 现物体探测与识别。由此可见,特征描述方法是物体探测器设计的基础,选择合适的特征描 述方法对探测器的整体性能影响很大。 设计探测器需要对合适的特征描述方法做出选择,但是此前的特征描述评估方法 都有不同的局限性。特定物体探测常使用的特征描述评估方法使用两张含有同一特定物 体的图像,计算对特征点/区域通过特征向量匹配结果的正确率。但是类属物体不是完全 相同的,无法确立精确匹配的特征点/特征向量。在类属物体探测上,常使用多种特征描述 方法与多种上层识别模型结合的衡量体制。但是该样的衡量方法会受到上层识别模型的影 响,其计算结果是有偏差的。
技术实现思路
本专利技术所要解决的技术问题是;针对上述存在的问题,提供一种对特征描述方法 进行衡量的方法,本方法既能表现同类物体中特征的相似性(可重复性),也能表现不同类 物体中特征的差异性(可区分性),对多种特征描述方法进行定量比较,从而选择最佳的特 征描述方法。 本专利技术采用的技术方案如下;[000引包括: 步骤1 ;对正样本的图像全部标识区域通过采样窗口进行均匀分布的采样;对负 样本的图像通过采样窗口进行均匀分布的采样; 步骤2 ;使用被衡量的特征描述方法,将正样本图像全部标识区域的全部采样窗 口和负样本图像的全部采样窗口分别对应转换为正特征向量Fp= (a 1,〇2... aj和负特 征向量町二(0。02... 0b},其个数分别记为A和B; 步骤3 ;使用一种聚类分析方法,依据正特征向量的空间分布距离,将正特征向量 划分成K个聚类{w。W2. . . wj,每个聚类中Wk称其为普通描述词,1《k《K,每个普通描述 词Wk是n个正特征向量a i的集合,W k是F P的子集,n《A,10《K《1000 ;若某普通描述 词包含的特征向量个数n《X,则删除该普通描述词;否则保留该普通描述词;其中X为正 样本数量的1%到50% ; 步骤4;对普通描述词汇Wk,使用一种概率分布模型计算概率分布密度公式参数 P(f|wk),然后使用所有的正特征向量QiG Fp,i = 1...A计算对该普通描述词汇的正可区 分值用所有的负特征向量Pj.G Fw,j = 1...B计算对该普通描 述词的负可区分值[001引步骤5 ;计算该普通描述词汇的可区分值为V(Wk) = Vp(Wk)+Vw(Wk); 步骤6 ;在所有普通描述词汇Wk中选择可区分值最高的M个区分值作为关键描述 词T = {ti,t,. . . t"},该M个关键描述词的区分度的总和为该特征描述方法的类属 物体探测性能衡量指标越大说明被衡量的特征描述方法更适合被测试物体的特 征描述,其中m = 1. . . M。 进一步的,所述步骤1中采样窗口即样本图像中的一个矩形区域。 还包括对正样本图像全部标识区域及负样 本图象进行多尺度缩放,所述多尺度缩放的最小缩放级别中,采样窗口为被评估特征描述 方法所需最小区域;在多缩放尺度的最大缩放级别中,正样本的采样窗口是包含整个图像 标识区域的最小区域,负样本的采样窗口是不超出图像边界的最大区域;多缩放尺度的采 样窗口从最小缩放级别到最大缩放级别W等比例递增,比例选择为1. 1倍至2倍之间;在同 一缩放尺度下,采样窗口均匀分布,相邻采样窗口间有5%到95%重叠面积。 进一步的,所述步骤3中一种聚类分析方法包含划分法、层次法、图论法、网格法、 K-Means 或 Mean Shift。[001引进一步的,所述步骤4中一种概率分布模型包含高斯分布、伯努力分布、二项分布 或泊松分布。 综上所述,由于采用了上述技术方案,本专利技术的有益效果是: 1、本专利技术提出了一个开放性的平台,特征向量式的特征描述描述方法均可化围过 本方法进行公平地比较;本专利技术适用于物体探测/识别器设计阶段,对特征描述方法进行 甄选。 2、本专利技术提出了一种独立的不依靠上层识别模型的衡量方法,针对可重复性和可 区分性两方面评估特征描述方法的方法; 3、本专利技术对被探测物体有针对性,充分反应了不同应用背景下,同种描述方法性 能的变化,可W根据应用背景有针对地作出选择; 4、使用多缩放尺度的样本采样窗口,充分保证了特征向量的探测性能不受缩放尺 度的影响。【具体实施方式】 本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥 的特征和/或步骤W外,均可任何方式组合。 本说明书(包括任何附加权利要求、摘要)中公开的任一特征,除非特别叙述,均 可被其他等效或具有类似目的的替代特征加W替换。目P,除非特别叙述,每个特征只是一系 列等效或类似特征中的一个例子而已。 本专利技术相关说明: 本专利技术方法的使用,需要有一个足够大且人工标记过的训练样本库。样本库中应 由不少于30张含有被探测或识别物体的图像做正样本,和不少于正样本5倍正样本数量且 不含有被探测或识别物体的图像做负样本。理想的正样本数量在1000张W上,负样本的数 量在正样本的10倍W上。正样本中被探测或识别物体所在的区域被标记。正样本包含一 种或更多的被探测或识别物体,负样本不包含被探测或识别物体,从而计算被衡量方法对 一种或多种被探测或识别物体的总体识别性能。[002引原理;本专利技术通过对待识别物体正负样本采样,并使用待衡量的特征描述方法 (不同的特征描述方法使得正样本的图像全部标识区域W及负样本的图像分别对应产生不 同的特征向量)转换正负采样为正负特征描述向量,然后通过聚类分析当前第1页1 2 本文档来自技高网
...

【技术保护点】
一种对特征描述方法进行衡量的方法,其特征在于包括:步骤1:对正样本的图像全部标识区域通过采样窗口进行均匀分布的采样;对负样本的图像通过采样窗口进行均匀分布的采样;步骤2:使用被衡量的特征描述方法,将正样本图像全部标识区域的全部采样窗口和负样本图像的全部采样窗口分别对应转换为正特征向量FP={α1,α2...αA}和负特征向量FN={β1,β2...βB},其个数分别记为A和B;步骤3:使用一种聚类分析方法,依据正特征向量的空间分布距离,将正特征向量划分成K个聚类{w1,w2...wK},每个聚类中wk称其为普通描述词,1≤k≤K,每个普通描述词wk是n个正特征向量αi的集合,wk是FP的子集,n≤A,10≤K≤1000;若某普通描述词包含的特征向量个数n≤X,则删除该普通描述词;否则保留该普通描述词;其中X为正样本数量的1%到50%;步骤4:对普通描述词汇wk,使用一种概率分布模型计算概率分布密度公式参数P(f|wk),然后使用所有的正特征向量αi∈FP,i=1...A计算对该普通描述词汇的正可区分值用所有的负特征向量βj∈FN,j=1...B计算对该普通描述词的负可区分值步骤5:计算该普通描述词汇的可区分值为V(wk)=VP(wk)+VN(wk);步骤6:在所有普通描述词汇wk中选择可区分值最高的M个区分值作为关键描述词T={t1,t2...tM},这M个关键描述词的区分度的总和为该特征描述方法的类属物体探测性能衡量指标,越大说明被衡量的特征描述方法更适合被测试物体的特征描述,其中m=1...M。...

【技术特征摘要】

【专利技术属性】
技术研发人员:隋运峰钟琦李华琼鄢丹青张中仅
申请(专利权)人:中国民用航空总局第二研究所
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1