一种基于改进的模糊C均值聚类的图像聚类方法及装置制造方法及图纸

技术编号:19481139 阅读:18 留言:0更新日期:2018-11-17 10:39
本发明专利技术涉及一种基于改进的模糊C均值聚类的图像聚类方法及装置,该方法包括:输入样本图像,计算样本图像的特征值向量;将样本图像的特征值向量作为输入样本点,采用自组织神经网络算法进行分类,确定初始的聚类中心和聚类数目;采用极大似然估计算法得出样本图像对各个类的归属概率,将该归属概率作为目标函数的权值以构建目标函数;根据初始的聚类中心和聚类数目,采用改进的模糊C均值聚类算法的判别公式,通过迭代计算下一次的聚类中心,直至相邻两次的目标函数值之间的变化量小于设定的阈值。本发明专利技术通过计算样本图像的特征值向量,采用自组织神经网络算法对图像进行粗聚类,确定初始的聚类中心和聚类数目,增强了聚类效果的稳定性和准确性。

【技术实现步骤摘要】
一种基于改进的模糊C均值聚类的图像聚类方法及装置
本专利技术涉及一种基于改进的模糊C均值聚类的图像聚类方法及装置,属于图像处理

技术介绍
21世纪是一个数据化、信息化的时代,随着医学成像技术的发展和普及,医院和医疗研究机构产生的医学影像数据,包括CT、MRI、X射线等,均呈现海量化的増长趋势,如何准确高效地对医学图像进行匹配检索成为当前研究的重要课题。基于内容的医学图像检索方法依赖于医学图像的视觉特征,如形状、纹理、颜色、灰度等,用户输入想要检索的医学图像,根据相似度大小,依次返回给用户。模糊C均值聚类相比“硬聚类”,它会计算每个样本对所有类的隶属度,若某样本对某类的隶属度在所有类的隶属度中具有绝对优势,则该样本分到这个类中是一个十分保险的做法。其中,在模糊C均值聚类算法中,聚类定义是模糊的,每个数据点对每个簇都存在一个隶属度,并且每个数据点对所有簇的隶属度之和为1。模糊C均值聚类算法的思想是:首先给定数据集X={x1,x2,...,xn},c为聚类类别数,Ci(i=1,2,…,c)为每个类的聚类中心,μij反映了第j个样本对第i类的隶属度,则模糊C均值聚类的判别函数(目标函数)为:其中,i表示第i个聚类中心,μij表示数据集第j个样本,xj隶属于第i个分类的隶属度,j表示第j个样本图像,m为加权指数,大多数情况下m的值为2,dij为第j个样本对第i个聚类中心的欧式距离。由于模糊C均值聚类算法的计算即为不断迭代使目标函数最小化的过程,给定聚类类别数,设定阈值范围,初始化聚类中心以后,重复计算隶属度μjt和聚类中心pi,当相邻两次目标函数结果的变化量小于设定的阈值时,迭代停止,此时认为算法收敛。其中,隶属度μjt和聚类中心pi的计算公式如下:其中,i为第i个聚类中心,m为加权指数,djt为第t个样本图像xt对第j个聚类中心的欧氏距离,dit为第t个样本图像xt对第i个聚类中心的欧氏距离,k为第k个聚类中心。由于模糊C均值聚类算法对初始值非常敏感,因此,模糊C算法中初始值的设定有很重要的意义。模糊C均值聚类方法存在以下缺点:(1)初始聚类数需要人为确定,使用伪随机数产生初始聚类中心造成聚类效果不稳定,容易得不到满意的效果;(2)采用现有的判别函数作为聚类目标,模糊C均值聚类效果常常不稳定,导致模糊C均值聚类结果准确度较低。
技术实现思路
本专利技术的目的是提供一种基于改进的模糊C均值聚类的图像聚类方法及装置,用于解决现有的初始聚类数和初始聚类中心会导致聚类效果不佳,进而影响图像检索效果的问题。为解决上述技术问题,本专利技术提供了一种基于改进的模糊C均值聚类的图像聚类方法,步骤如下:输入样本图像,计算样本图像的特征值向量;将样本图像的特征值向量作为输入样本点,采用自组织神经网络算法进行分类,确定初始的聚类中心和聚类数目;采用极大似然估计算法得出样本图像对各个类的归属概率,将该归属概率作为目标函数的权值以构建目标函数;根据初始的聚类中心和聚类数目,通过迭代计算下一次的聚类中心,直至相邻两次的目标函数值之间的变化量小于设定的阈值。本专利技术的有益效果是:通过计算样本图像的特征值向量,采用自组织神经网络算法对图像进行粗聚类,确定初始的聚类中心和聚类数目,增强了聚类效果的稳定性,进而增强了图像检索的准确性,并且为了增强模糊C均值聚类算法的聚类结果准确度,还包括采用极大似然估计算法得出样本图像对各个类的归属概率,将该归属概率作为目标函数的权值以构建目标函数。进一步的,为了使整体图像的灰度像素分布均匀,增强图像的对比度,还包括对样本图像进行去噪处理。进一步的,运用灰度共生矩阵计算样本图像的特征值向量。进一步的,采用高斯滤波方法对样本图像进行去噪处理。进一步的,样本图像的特征值向量包括角二阶矩、对比度、自相关、同质性/逆差距和熵。本专利技术还提供了一种基于改进的模糊C均值聚类的图像聚类装置,包括处理器和存储器,所述处理器用于处理存储在存储器中的指令以实现如下方法:输入样本图像,计算样本图像的特征值向量;将样本图像的特征值向量作为输入样本点,采用自组织神经网络算法进行分类,确定初始的聚类中心和聚类数目;采用极大似然估计算法得出样本图像对各个类的归属概率,将该归属概率作为目标函数的权值以构建目标函数;根据初始的聚类中心和聚类数目,通过迭代计算下一次的聚类中心,直至相邻两次的目标函数值之间的变化量小于设定的阈值。进一步的,还包括对样本图像进行去噪处理。进一步的,运用灰度共生矩阵计算样本图像的特征值向量。进一步的,采用高斯滤波方法对样本图像进行去噪处理。进一步的,样本图像的特征值向量包括角二阶矩、对比度、自相关、同质性/逆差距和熵。附图说明图1是本专利技术基于改进的模糊C均值聚类的图像聚类方法的流程图;图2是自组织神经网络模型图;图3是输入的图像1的示意图;图4是系统一对图像1的检索结果;图5是系统二对图像1的检索结果;图6是输入的图像2的示意图;图7是系统一对图像2的检索结果;图8是系统二对图像2的检索结果;图9是输入的图像3的示意图;图10是系统一对图像3的检索结果;图11是系统二对图像3的检索结果;图12是输入的图像4的示意图;图13是系统一对图像4的检索结果;图14是系统二对图像4的检索结果;图15是输入的图像5的示意图;图16是系统一对图像5的检索结果;图17是系统二对图像5的检索结果;图18是本算法与经典的模糊C均值聚类算法的检索结果的查全率;图19是本算法与经典的模糊C均值聚类算法的检索结果的查准率。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例对本专利技术进行进一步详细说明。本专利技术提供了一种基于改进的模糊C均值聚类的图像聚类装置,包括处理器和存储器,处理器用于处理存储在存储器中的指令,以实现一种基于改进的模糊C均值聚类的图像聚类方法,该聚类方法可以应用于医学图像的聚类,也可以应用于其他类型的图像的聚类。具体来说,该方法的流程图如图1所示,包括以下步骤:(1)输入样本图像,对样本图像进行去噪处理。在本实施例中,在进行聚类之前,首先对图像库中输入的图像进行统一的高斯滤波处理,进而将图像中的灰度像素点作为映射,使得整体图像的灰度像素分布均匀,增强图片的对比度。在具体实施时,运用Matlab软件对图像进行高斯滤波处理,它是对整幅图像进行加权平均的过程,每一个像素点的值都由其本身与邻域内的其他像素的值经过加权平均后得到。高斯滤波函数h(x,y)为:其中,x2和y2分别表示邻域的其他像素与邻域中心像素的距离,σ表示标准差。离散的高斯卷积核H是(2k+1)×(2k+1)维矩阵,其元素的计算函数为:其中,σ为方差,k为核矩阵的维数。对图像进行高斯滤波处理的方法属于现有技术,此处不再赘述。当然,作为其他的实施方式,也可以采用现有技术中其他的去噪方法对对样本图像进行去噪处理。(2)计算样本图像的特征值向量,将样本图像的特征值向量作为输入样本点,采用自组织神经网络算法进行分类,确定初始的聚类中心和聚类数目。也就是说,为确定初始聚类中心和聚类数目,在模糊C均值聚类的基础上加入了“自组织神经网络”的方法。其中,自组织神经网络是一种竞争学习型的无监督神经网络,它能将高维输入数据映射到二维空间,即将高维空间中相似本文档来自技高网
...

【技术保护点】
1.一种基于改进的模糊C均值聚类的图像聚类方法,其特征在于,步骤如下:输入样本图像,计算样本图像的特征值向量;将样本图像的特征值向量作为输入样本点,采用自组织神经网络算法进行分类,确定初始的聚类中心和聚类数目;采用极大似然估计算法得出样本图像对各个类的归属概率,将该归属概率作为目标函数的权值以构建目标函数;根据初始的聚类中心和聚类数目,通过迭代计算下一次的聚类中心,直至相邻两次的目标函数值之间的变化量小于设定的阈值。

【技术特征摘要】
1.一种基于改进的模糊C均值聚类的图像聚类方法,其特征在于,步骤如下:输入样本图像,计算样本图像的特征值向量;将样本图像的特征值向量作为输入样本点,采用自组织神经网络算法进行分类,确定初始的聚类中心和聚类数目;采用极大似然估计算法得出样本图像对各个类的归属概率,将该归属概率作为目标函数的权值以构建目标函数;根据初始的聚类中心和聚类数目,通过迭代计算下一次的聚类中心,直至相邻两次的目标函数值之间的变化量小于设定的阈值。2.根据权利要求1所述的基于改进的模糊C均值聚类的图像聚类方法,其特征在于,还包括对样本图像进行去噪处理。3.根据权利要求1或2所述的基于改进的模糊C均值聚类的图像聚类方法,其特征在于,运用灰度共生矩阵计算样本图像的特征值向量。4.根据权利要求2所述的基于改进的模糊C均值聚类的图像聚类方法,其特征在于,采用高斯滤波方法对样本图像进行去噪处理。5.根据权利要求3所述的基于改进的模糊C均值聚类的图像聚类方法,其特征在于,样本图像的特征值向量包括角二阶矩、对比度、自相关、同质性/逆差距和熵。6.一种基于改进的模糊C均值聚类...

【专利技术属性】
技术研发人员:孙林何嘉玉赵建国李鹏飞李晓艳陈岁岁刘弱南秦小营赵婧殷腾宇王学敏
申请(专利权)人:河南师范大学
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1