【技术实现步骤摘要】
一种图像分类方法
本专利技术属于模式识别、机器学习
,具体涉及到一种图像分类方法。
技术介绍
自形式概念分析提出以来,凭借着独特的关系表示形式,成为数据分析领域一种高效的研究工具,形式概念分析已成功应用于推荐系统、数据挖掘等相关研究领域。概念认知是近年来兴起的一个研究方向,具有跨学科特点,涉及到心理学、脑信息科学、计算机科学等诸多研究领域,现有的研究证明,概念认知学习是一种高效的信息处理方式,但是已有的研究大多停留在理论论证层面。目前,形式概念分析在图像领域的应用较少,主要原因在于概念格固有的时间复杂度不能有效的处理图像中的多维信息。为此,如何将图像数据转化为形式背景并构建一个高效的学习模型,是该技术方法的关键问题之一。
技术实现思路
为了解决上述问题,本专利技术提出一种将图像数据转化为形式背景并构建一个学习模型的方法,通过图像特征提取技术、特征数据处理技术和概念学习方法解决形式概念认知难以应用在图像方面的问题。本专利技术采用的技术方案为:一种图像分类方法,包括认知训练模块和图像分类模块,< ...
【技术保护点】
1.一种图像分类方法,包括认知训练模块和图像分类模块,所述认知训练模块,用来学习图像概念,最终生成一棵概念树用来实现图像分类任务;所述图像分类模块,使用认知训练模块得到的概念树进行图像分类;其特征在于,该方法包括如下步骤:/n步骤一,对图像数据集IS中的每个图像p,使用PCA-SIFT方法提取图像特征描述FD,/n图像特征描述FD维度为N
【技术特征摘要】
1.一种图像分类方法,包括认知训练模块和图像分类模块,所述认知训练模块,用来学习图像概念,最终生成一棵概念树用来实现图像分类任务;所述图像分类模块,使用认知训练模块得到的概念树进行图像分类;其特征在于,该方法包括如下步骤:
步骤一,对图像数据集IS中的每个图像p,使用PCA-SIFT方法提取图像特征描述FD,
图像特征描述FD维度为Np*Z,定义如下:
其中,任意一行Z维向量称之为图像p的图像特征描述子,表示为1≤n≤Np,Np表示图像p的特征描述子数量;
步骤二,将所有图像的图像特征描述FD纵向拼接,生成图像集特征矩阵FDM,
图像集特征矩阵FDM维度为(∑p∈IsNp*Z),定义如下:
其中,任意一行Z维向量称之为图像p的特征描述子,表示为1≤n≤∑p∈ISNp;
步骤三,对图像集特征矩阵FDM使用K-Means聚类方法,得到M个聚类中心,每个中心为一个词袋word,使用词袋集向量WS存储词袋,
词袋集向量WS维度为(1*M),定义如下:
WS=[word1,word2,word3,......,wordM]
其中每个wordj,1≤j≤M,是一个聚类中心;
步骤四,将图像集特征矩阵FDM,划分到词袋集向量WS的聚类中心中,转化为图像集特征分布矩阵CDM,步骤如下:
1)初始化向量CDP=[sum1,sum2,sum3,......,sumM],其中M=|WS|,每个元素sumj表示被划分到词袋wordj中的图像p特征描述子的个数,为自然数,初始值为0;初始化图像集的特征分布矩阵进入步骤2);
2)若图像集IS中的有未处理的图片p,则进入步骤3);否则进入步骤5);
3)依据欧式距离远近,将图片p的特征描述FD中Np个Z维向量划分到词袋集向量最近距离的词袋wordj中,相应的Sumj累加1;经过划分之后,每幅图像由一个M维特征分布向量CDp表示;进入步骤4);
4)将CDp纵向拼接到图像集的特征分布矩阵CDM中,进入步骤2);
5)结束;
其中,图像集特征分布矩阵CDM维度为(|IS|*M),定义如下:
其中,任意一行M维向量为图P的图像特征分布向量,表示为CDP;
图像类别向量CLSM维度为(1*|IS|),定义如下:
CLSM=[i1,i2,......,ip]
其中,i是图像的类别,即i∈CLS,CLS表示数据集图像类别集合,ip存储图像p的类别,p∈IS,CLSM中元素为CDM对应次序图像的类别;
步骤五,对图像集特征分布矩阵CDM进行二值化转化,生成图像集形式背景K;
图像集形式背景K为一个三元组IS,WS,R,其中IS是图像对象,WS是词袋属性,R是两者之间的二元关系,即pRw,p∈IS,w∈WS,
图像集形式背景维度为|IS|*M,定义如下:
其中,任意一行M维向量表示图像p所包含的属性,p∈IS,1≤j≤M,
表示属性wordj在数据集IS中出现的次数与样本总数比值;
图像集特征分布矩阵CDM生成图像集形式背景K的步骤如下:
1)初始化向量Kp=[k1,k2,k3,......,kM],每个元素kj表示图像p与属性wordj间的二元关系,初始值为0,初始化向量计算出属性wordj的均值初始化图像集形式背景进入步骤2);
2)若存在未处理的kpj,进入步骤3);否则进入步骤5);
3)将CDMp(j)与比较,将kj设置为1,相反为0,进入步骤4);
4)将Kp纵向拼接到图像集形式背景K,进入步骤2);
5)结束;
步骤六,由图像集形式背景K生成必要属性集合Base,必要属性集合Base的定义如下:
其中,Base(i)表示第i类图像的必要属性集合,Kp(j)表示图像p与第j个属性间二元关系,ISi表示数据集IS中第i类图像,此处表示属性wordj在第i类中出现的次数与本类样本总数比值,T为阈值,超过该值则定为必要属性;
获取必要属性集合的步骤如下:
1)初始化集合其中i∈CLS,CLS为图像集IS中类别集合,初始化向量进入步骤2);
2)若Kp中存在未处理属性wordj,1≤j≤M,计算出属性wordj的均值进入步骤3);否则进入步骤4);
3)如果则将属性wordj加入到Base(i),进入步骤2);
4)结束;
步骤七,由必要属性构造概念树CT的粗层次,
概念:(...
【专利技术属性】
技术研发人员:申培正,张卓,王黎明,柴玉梅,
申请(专利权)人:郑州大学,
类型:发明
国别省市:河南;41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。