基于先验知识的概率协同表示图像集分类方法技术

技术编号:33888024 阅读:28 留言:0更新日期:2022-06-22 17:21
本发明专利技术公开了一种基于先验知识的概率协同表示图像集分类方法,以此来解决图像集分类中协同表示对类间差异学习不足导致的概率表示失效的问题;算法模型中,将图像集集合看作是流形空间上的一个点,通过基于样本间距离的表示方法,推导出在对称正定矩阵空间上对图像集集合模型的概率协同表示方式,并且通过对表示样本的学习,抽取出样本的先验知识,对模型的概率表示重新加权,最后推导出相应的闭式解。在不同的数据集合上对比了该算法,实验表明,模型在不平衡的数据集上有着非常出色的分类成绩表现,更加关注样本特征,解决了协同表示方法中类间模糊性导致的难以分类的问题。示方法中类间模糊性导致的难以分类的问题。示方法中类间模糊性导致的难以分类的问题。

【技术实现步骤摘要】
基于先验知识的概率协同表示图像集分类方法


[0001]本专利技术涉及一种概率协同表示图像集分类方法,特别是一种基于先验知识的概率协同表示图像集分类方法。

技术介绍

[0002]随着当下数据传输技术与存储技术的快速发展,图像和视频已经是非常常见的内容表现形式,同时带来的就是模式识别领域对于图像处理的应用。在图像处理任务和机器学习中,以其多视图的表达能力,基于图像集的分类方法也引起产业界和学界的广泛关注。图像集相较于单一图像的识别,更能够突出样本间的关系,从而实现更好的分类。但是图像集合样本的类内多样性和类间模糊性仍然是非常重要的问题方向。
[0003]在分类任务中,稀疏表示是一种非常有效的方法。他能够快速准确的抽取样本中的特征并能够准确地进行分类,在图像分类领域也是这样。稀疏表示分类算法(SRC)是一种非常有效的分类方法,被广泛使用在常见的分类场景中并被不断的改进。SRC通过基于数据集样本对测试样本进行稀疏编码,以最小的编码损失来确定样本分类。并且使用了l1正则化范数来规范化稀疏编码矩阵。但后来有学者提出并证明SRC的效果很大程度上是归因于通过所有类的训练样本对一个测试样本进行协同表示的特性,随后他们提出通过使用l2范数的协同表示分类器(CRC)。SRC/CRC分类器可以被看作是基于距离的分类器,因为分类的原理都是基于查询样本和每个类的表示样本之间的距离的。很多SRC/CRC的改进迭代版本已经应用到了人脸识别和其他视觉识别的任务里。受到CRC的启发,基于图像集的协同表示分类算法(ISCRC)被提出。他将CRC扩展到了图像集分类的任务上并且取得了非常不错的效果。但是,ISCRC是基于欧式空间的,这会降低他的算法表现并带来非常大的计算开销,而且ISCRC只是适用于人脸识别。最近十几年,线性子空间统计建模已经大量的运用在了基于视频的图像集分类问题中。在这些方法中,通过抽取视频中的图像帧并整理成图像集合,然后通过主成分分析对图像集降维表示,得到一个线性子空间,从而能够对视频中的图像变化模式进行建模,这样的处理方法在非限定条件的基于视频的图像集分类中能够稳定应对一些复杂的类内变化(比如人脸的表情,着装等)。虽然这些方法极大的推进了子空间在图像集分类领域的应用,但是由于线性子空间有其特有的非欧式几何结构,如何设计识别算法一直是一个棘手的问题。最近,大量的工作表明具有相同的维数的线性子空间可以看作是特定流形上的一个样本点,这样的流形被称为格拉斯曼流形(Grassmann Manifold),但是非欧式空间的特征使得很多优秀的欧氏空间的模式识别技术无法很好的应用在上面。因此,有学者提出通过使用投影映射(Projection Mapping)框架将格拉斯曼流形上的基本元素表示成对应的投影矩阵。由于投影矩阵所推导出的投影距离可以近似的表示格拉斯曼流形的真实的测地距离,并且这样的投影距离还满足重要的距离度量三要素:非负性、对称性、三角不等式。因而可以通过投影距离来估计格拉斯曼流形的黎曼几何进而将欧氏空间上的传统算法推广到格拉斯曼流形上。比如在基于稀疏编码表示的方法中,格拉斯曼稀疏编码表示方法(GSC)通过在对称矩阵空间中嵌入格拉斯曼流形来研究稀疏编码和字典学习
问题。由于其具有的过高的复杂度,有学者受概率协同表示(ProCRC)启发,基于概率协同表示的图像集分类器(PGCRC)被提出,对于图像集分类任务从概率的角度上给出了一个封闭形式的解释。但基于协同表示的方法还是没有充分利用好类间的表示差异,难以挖掘出样本类内的多样性信息。

技术实现思路

[0004]本专利技术的目的在于提供一种基于先验知识的概率协同表示图像集分类方法,并结合线性鉴别方法,提高样本散度,使被应用的先验知识更加有效,完成对图像集的高准确率分类。
[0005]实现本专利技术目的的技术解决方案为:一种基于先验知识的概率协同表示图像集分类方法,包括以下步骤:
[0006]步骤1、通过子空间方法,获取图像集集合的子空间[X1,X2,...,X
N
];
[0007]步骤2、通过假设图像集样本点位于格拉斯曼流形空间上,应用投影度量方法,将图像集样本数据[X1,X2,...,X
N
]转换成对称矩阵空间上的点[g(X1),g(X2),...,g(X
N
)],其中g(X)=XX
T
,N是类数量;
[0008]步骤3、对[g(X1),g(X2),...,g(X
N
)]应用线性鉴别表示得到分离分布的表示样本,随后使用最近邻算法计算出每个类样本与整体样本质心之间的距离,即每个类的先验知识:β={β1,......,β
k
};
[0009]步骤4、在格拉斯曼流形上构造概率协同表示算法模型,融入步骤3习得的先验知识β;对概率协同表示算法模型分析求解,得到最终基于图像集先验知识的表示稀疏系数α;
[0010]步骤5、通过分类算法,得出对于测试图像集的分类结果。
[0011]一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述的基于先验知识的概率协同表示图像集分类方法。
[0012]一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的基于先验知识的概率协同表示图像集分类方法。
[0013]与现有技术相比,本专利技术的显著优点在于:通过学习样本的先验知识,能够充分挖掘出各个类样本与整体类样本的关系,充分发挥概率协同表示的表示能力。其中,详细地分析训练数据集,并通过最近邻算法,学习得到最适合数据集的先验知识数据。并且将先验知识融入概率协同表示框架,非常好的解决了样本间地差异问题。
[0014]下面结合附图对本专利技术作进一步详细描述。
附图说明
[0015]图1是本专利技术中基于先验知识的概率协同表示图像集分类方法的操作流程示意图。
[0016]图2是本专利技术中基于先验知识的概率协同表示图像集分类方法的示意图。
[0017]图3是本专利技术方法与格拉斯曼概率协同表示(PGCRC)的参数敏感性表现比较。上下分别是格拉斯曼概率协同表示(PGCRC)和本专利技术方法在不同参数设置下的表现,并且横轴为参数λ1(取值范围为0.5~3),纵轴为参数λ2(取值范围为0.1~1)。
具体实施方式
[0018]结合图1,本专利技术的基于先验知识的概率协同表示图像集分类方法包括以下步骤:
[0019]步骤1、通过子空间学习算法学习相应图像集的子空间表示,训练集:[X1,X2,...,X
N
],测试样本:Y。
[0020]步骤2、通过假设图像集样本点位于格拉斯曼流形(Grassmann Manifold)空间上,应用投影度量方法,将图像集样本数据[X1,X2,...,X
N
]、Y转换成对称矩阵空间上的点[g(X1),g(X2),...,g(X
N
)],其中g(X)=XX
T...

【技术保护点】

【技术特征摘要】
1.一种基于先验知识的概率协同表示图像集分类方法,其特征包括以下步骤:步骤1、通过子空间方法,获取图像集集合的子空间[X1,X2,...,X
N
];步骤2、通过假设图像集样本点位于格拉斯曼流形空间上,应用投影度量方法,将图像集样本数据[X1,X2,...,X
N
]转换成对称矩阵空间上的点[g(X1),g(X2),...,g(X
N
)],其中g(X)=XX
T
,N是类数量;步骤3、对[g(X1),g(X2),...,g(X
N
)]应用线性鉴别表示得到分离分布的表示样本,随后使用最近邻算法计算出每个类样本与整体样本质心之间的距离,即每个类的先验知识:β={β1,......,β
k
};步骤4、在格拉斯曼流形上构造概率协同表示算法模型,融入步骤3习得的先验知识β;对概率协同表示算法模型分析求解,得到最终基于图像集先验知识的表示稀疏系数α;步骤5、通过分类算法,得出对于测试图像集的分类结果。2.根据权利要求1所述的基于先验知识的概率协同表示图像集分类方法,其特征在于:步骤3中所述从图像集表示数据集中,在格拉斯曼流形空间下学习训练数据的先验知识,具体为:将训练数据映射到图像集上,通过线性鉴别分析处理图像集,单独计算每一个类别的图像集样本的质心和全体样本的质心,通过计算整体样本质心和每个类的样本质心的距离,从而获得k个先验知识系数;计算方式如下:其中,n
k
是每个类的样本数。3.根据权利要求1所述的基于先验知识的概率协同表示图像集分类方法,其特征在于:步骤4中在格拉斯曼流形上构造基于先验...

【专利技术属性】
技术研发人员:孙权森顾正召魏东
申请(专利权)人:南京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1