一种基于K‑均值聚类的图像特征提取方法技术

技术编号:14479662 阅读:81 留言:0更新日期:2017-01-25 12:19
本发明专利技术提供了一种基于K‑均值聚类的图像特征提取方法,该方法包括步骤S1:采集图像并对图像进行预处理,以及建立图像数据库;步骤S2:利用K‑均值聚类算法对图像进行聚类分析,将图像数据库分为K类;步骤S3:利用主成分分析算法对分为K类的图像数据库中的分类图像进行处理,得到主成分分析图像;步骤S4:根据性能指标估计主成分分析图像,选取效果最好的图像。本发明专利技术提高了图像特征提取的性能,可有效地提取多光谱图像中的非线性特征信息,同时也改善了图像特征提取计算量大的缺点,结合传统的主成分分析算法,引入了高斯核函数,使得主成分分析算法变得更加鲁棒,在图像的特征提取中具有更好的效果。

【技术实现步骤摘要】

本专利技术涉及图像识别
,具体涉及一种基于K-均值聚类的图像特征提取方法。
技术介绍
图像的识别分类在所有应用领域中的应用最为直接,由于获取的图像数据内容丰富,提取图像的特征技术就变得非常关键,传统的图像特征提取主要包含光谱特征、纹理特征以及形状特征。常用的光谱特征提取方法有主成分分析法、K-T变换、典型分析法以及基于遗传算法的特征提取算法。主成分分析法是图像中最常用的一种变换算法,是一种非常有效的特征提取算法,但是这种算法需要处理的数据非常大,因为图像中包含大量的观测数据,造成了计算复杂度大大增加。鉴于上述缺陷,本专利技术创作者经过长时间的研究和实践终于获得了本专利技术。
技术实现思路
为解决上述技术缺陷,本专利技术采用的技术方案在于,提供一种基于K-均值聚类的图像特征提取方法,该方法包括以下步骤:步骤S1:采集图像并对图像进行预处理,以及建立图像数据库;步骤S2:利用K-均值聚类算法对图像进行聚类分析,将图像数据库分为K类;步骤S3:利用主成分分析算法对分为K类的图像数据库中的分类图像进行处理,得到主成分分析图像;步骤S4:根据性能指标估计主成分分析图像,选取效果最好的图像。较佳的,述步骤S1具体包括:步骤S11:通过图像采集设备采集图像;步骤S12:对所获取的图像进行尺寸大小归一化;步骤S13:建立图像数据库。较佳的,所述步骤S2具体包括:步骤S21:统计图像数据库中每一幅图像的波段数和像素数,并将其表示为一个矩阵X;步骤S22:根据主成分分析算法的需求输入指定数目的聚类类数N;步骤S23:在初始矩阵X中随机选取N个对象作为初始聚类中心;步骤S24:根据每个聚类的中心,计算每个对象与这些中心对象的距离,并根据最小距离重新对相应对象进行划分,形成一类;步骤S25:更新聚类中心,然后以每一类的平均向量作为新的聚类中心,重新分配数据对象;步骤S26:反复迭代,直到满足每个聚类不再发生变化为止。较佳的,所述步骤S3具体包括:步骤S31:选取新获得的聚类中心作为新的输入样本;步骤S32:利用高斯核函数和新输入的样本计算核矩阵K,核矩阵K的计算公式为:式中,xi,xj为样本向量,c表示输入的样本数量,表示对样本向量的非线性变换,k(·)表示高斯核函数;步骤S33:对核矩阵K进行归一化处理得到归一化之后的核矩阵K′:K′=(K-AcK-KAc+AcKAc)ij式中,Ac是一个c×c矩阵,(Ac)ij=1/c;步骤S34:分别计算归一化之后的核矩阵K′的特征值和特征向量,并对特征向量进行归一化处理;步骤S35:将特征值按照从大到小的顺序进行排列,选择前r个非零的特征值对应的特征向量αi作为主分量;步骤S36:将特征空间中所有的光谱向量映射到与第r个特征值对应的特征向量Vr,映射公式为:步骤S37:将所得向量恢复为图像,得到第r幅主成分图像,依次得到所有的主成分图像。较佳的,所述步骤S4具体包括:步骤S41:分别计算各主成分数据的方差,并对其标准化处理;步骤S42:计算每一分量标准方差的比例;步骤S43:根据得到的比例大小选择出效果最好的图像。与现有技术相比,本专利技术提供的一种基于K-均值聚类的图像特征提取方法有如下好处:(1)本专利技术将K-均值聚类算法应用到图像特征提取中,提高了图像特征提取的性能,可有效地提取多光谱图像中的非线性特征信息,同时也改善了图像特征提取计算量大的缺点。(2)结合传统的主成分分析算法,引入了高斯核函数,使得主成分分析算法变得更加鲁棒,在图像的特征提取中具有更好的效果。附图说明为了更清楚地说明本专利技术各实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。图1为本专利技术的一种基于K-均值聚类的图像特征提取方法的流程图;图2为步骤S1的流程图;图3为步骤S2的流程图;图4为步骤S3的流程图;图5为步骤S4的流程图。具体实施方式以下结合附图,对本专利技术上述的和另外的技术特征和优点作更详细的说明。如图1所示,为本专利技术的一种基于K-均值聚类的图像特征提取方法的流程图,该方法包括以下步骤:步骤S1:采集图像并对图像进行预处理,以及建立图像数据库。如图2所示,为步骤S1的流程图,该步骤S1具体包括:步骤S11:通过图像采集设备采集图像。步骤S12:对所获取的图像进行尺寸大小归一化。步骤S13:建立图像数据库。步骤S2:利用K-均值聚类算法对图像进行聚类分析,将图像数据库分为K类。如图3所示,为步骤S2的流程图,该步骤S2具体包括:步骤S21:统计图像数据库中每一幅图像的波段数和像素数,并将其表示为一个矩阵X。步骤S22:根据主成分分析算法的需求输入指定数目的聚类类数N。步骤S23:在初始矩阵X中随机选取N个对象作为初始聚类中心。步骤S24:根据每个聚类的中心,计算每个对象与这些中心对象的距离,并根据最小距离重新对相应对象进行划分,形成一类。步骤S25:更新聚类中心,然后以每一类的平均向量作为新的聚类中心,重新分配数据对象。步骤S26:反复迭代,直到满足每个聚类不再发生变化为止。步骤S3:利用主成分分析算法对分为K类的图像数据库中的分类图像进行处理,得到主成分分析图像。如图4所示,为步骤S3的流程图,该步骤S3具体包括:步骤S31:选取新获得的聚类中心作为新的输入样本。步骤S32:利用高斯核函数和新输入的样本计算核矩阵K,核矩阵K的计算公式为:式中,xi,xj为样本向量,c表示输入的样本数量,表示对样本向量的非线性变换,k(·)表示高斯核函数。步骤S33:对核矩阵K进行归一化处理得到归一化之后的核矩阵K′:K′=(K-AcK-KAc+AcKAc)ij式中,Ac是一个c×c矩阵,(Ac)ij=1/c。步骤S34:分别计算归一化之后的核矩阵K′的特征值和特征向量,并对特征向量进行归一化处理。步骤S35:将特征值按照从大到小的顺序进行排列,选择前r个非零的特征值对应的特征向量αi作为主分量。步骤S36:将特征空间中所有的光谱向量映射到与第r个特征值对应的特征向量Vr,映射公式为:步骤S37:将所得向量恢复为图像,得到第r幅主成分图像,依次得到所有的主成分图像。步骤S4:根据性能指标估计主成分分析图像,选取效果最好的图像。如图5所示,为步骤S4的流程图,该步骤S4具体包括:步骤S41:分别计算各主成分数据的方差,并对其标准化处理。步骤S42:计算每一分量标准方差的比例。步骤S43:根据得到的比例大小选择出效果最好的图像。本专利技术提供的一种基于K-均值聚类的图像特征提取方法有如下好处:(1)本专利技术将K-均值聚类算法应用到图像特征提取中,提高了图像特征提取的性能,可有效地提取多光谱图像中的非线性特征信息,同时也改善了图像特征提取计算量大的缺点。(2)结合传统的主成分分析算法,引入了高斯核函数,使得主成分分析算法变得更加鲁棒,在图像的特征提取中具有更好的效果。以上所述仅为本专利技术的较佳实施例,对本专利技术而言仅仅是说明性的,而非限制性的。本专业技术人员理解,在本专利技术权利要求所限定的精神和范围内可对其进行许多改变,修改,甚至等效,但都将落入本专利技术的保护范围内。本文档来自技高网...
一种<a href="http://www.xjishu.com/zhuanli/55/201610786955.html" title="一种基于K‑均值聚类的图像特征提取方法原文来自X技术">基于K‑均值聚类的图像特征提取方法</a>

【技术保护点】
一种基于K‑均值聚类的图像特征提取方法,其特征在于,该方法包括以下步骤:步骤S1:采集图像并对图像进行预处理,以及建立图像数据库;步骤S2:利用K‑均值聚类算法对图像进行聚类分析,将图像数据库分为K类;步骤S3:利用主成分分析算法对分为K类的图像数据库中的分类图像进行处理,得到主成分分析图像;步骤S4:根据性能指标估计主成分分析图像,选取效果最好的图像。

【技术特征摘要】
1.一种基于K-均值聚类的图像特征提取方法,其特征在于,该方法包括以下步骤:步骤S1:采集图像并对图像进行预处理,以及建立图像数据库;步骤S2:利用K-均值聚类算法对图像进行聚类分析,将图像数据库分为K类;步骤S3:利用主成分分析算法对分为K类的图像数据库中的分类图像进行处理,得到主成分分析图像;步骤S4:根据性能指标估计主成分分析图像,选取效果最好的图像。2.根据权利要求1所述的图像识别方法,其特征在于,所述步骤S1具体包括:步骤S11:通过图像采集设备采集图像;步骤S12:对所获取的图像进行尺寸大小归一化;步骤S13:建立图像数据库。3.根据权利要求2所述的图像识别方法,其特征在于,所述步骤S2具体包括:步骤S21:统计图像数据库中每一幅图像的波段数和像素数,并将其表示为一个矩阵X;步骤S22:根据主成分分析算法的需求输入指定数目的聚类类数N;步骤S23:在初始矩阵X中随机选取N个对象作为初始聚类中心;步骤S24:根据每个聚类的中心,计算每个对象与这些中心对象的距离,并根据最小距离重新对相应对象进行划分,形成一类;步骤S25:更新聚类中心,然后以每一类的平均向量作为新的聚类中心,重新分配数据对象;步骤S26:反复迭代,直到满足每个聚类不再...

【专利技术属性】
技术研发人员:简宋全李青海邹立斌窦钰景
申请(专利权)人:广州精点计算机科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1