基于模糊聚类的凝胶蛋白分割方法技术

技术编号:15299667 阅读:85 留言:0更新日期:2017-05-12 01:49
本发明专利技术公开了基于模糊聚类的凝胶蛋白分割方法,一:对图像进行滤波并增强图像的对比度;二:初始化聚类类别数、加权指数、迭代终止阈值、最大迭代次数及初始聚类中心;三:计算核函数中的径向宽度值;四:更新隶属度矩阵和聚类中心;五:比较当前新的聚类中心与上一次聚类中心的绝对差值是否小于迭代终止阈值,或者当前迭代计数器值是否大于最大迭代次数,若成立则停止并输出最终的隶属度矩阵和聚类中心,进入六继续执行;否则,迭代计数器加一后转向四继续执行;六:去模糊化,得到最优的分割结果。提高了消除噪声的能力,能够分离出相对较弱的蛋白点,因此分离出的蛋白点更多并且对轻度重叠蛋白点也具有较好的分离效果,具有较高的分割精度。

Segmentation method of gel protein based on Fuzzy Clustering

The invention discloses a segmentation gel protein based on fuzzy clustering method: image filtering and image contrast enhancement; two: initial clustering number, weighted index, iteration termination threshold, the maximum number of iterations and the initial clustering center; three: the calculation of the radial width of kernel value; four: update membership matrix and clustering center; five: absolute difference comparison of the current new clustering center and a cluster center is smaller than the iteration termination threshold, or the current iteration counter value is greater than the maximum number of iterations, if established stops and outputs the final clustering centers and membership matrix into six to continue; otherwise, the iteration counter a after turning four to continue; six: defuzzification, get the optimal segmentation results. Improve the ability of eliminating noise, can be separated relatively weak protein isolated, therefore more and slightly overlapping of protein protein has good separation effect, high accuracy of segmentation.

【技术实现步骤摘要】

本专利技术涉及双向凝胶图像分析
,尤其涉及基于模糊聚类的凝胶蛋白分割方法
技术介绍
在诸多蛋白质分离方法中,双向凝胶电泳(2-DE)技术广泛的应用在蛋白质组学中,主要是根据蛋白质等电点和分子量的差异,将复杂蛋白质混合物中的蛋白质在一块凝胶上以点状的形式分离。随后使用扫描设备对蛋白质凝胶进行扫描,得到数字化凝胶图像。在图像上蛋白质呈现出形状、大小和灰度各不相同的点,其中每一个点代表了一个特定的蛋白质。分割是图像分析的重要步骤,凝胶图像的研究需要从图像中提取出蛋白点,其主要的目标是找到蛋白点的位置和蛋白点周围的边界,确定它们的数量并分析蛋白质的不同状态。模糊聚类应用于模式识别、图像处理、水质分析等领域。在一些具体的识别应用中,如语音识别中的分类和匹配,雷达目标识别中目标库的建立和新到目标的归类等方面取得了较好的效果;在图像处理中广泛的应用于图像分割,如纹理图像、医学图像以及航空遥感图像等分割方面,有效解决了图像目标区域边界模糊性,遥感图像中典型的混合像元等问题。图像分割就是根据灰度、颜色、纹理和形状等特征,把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。凝胶蛋白图像分割的优点就是将图像分离成点和无点区域,以便更好的对蛋白质进行评估,现有的针对凝胶图像的分割方法有以下几种:基于边缘检测的分割方法,通过检测不同区域的边缘来进行分割,对于边缘定位精度和边界的确定有很好的分割效果并且保留了图像重要的结构属性,但极易受到噪声和图像自身模糊程度的影响。毕玉慧等人针对分水岭算法过分割的问题,提出了利用拓扑曲率与分水岭算法相结合的分割算法,该方法对于凝胶电泳图像更具针对性。张彦清等提出的基于马尔科夫随机场的凝胶电泳图像分割算法,是根据贝叶斯定理实现图像的分割,该过程中通过了一个二阶逻辑模型(MLL)模糊聚类作为先验知识获取其先验概率并因此得到后验概率,并引入了灰度点密度权值来实现聚类和均值方差的改进更新。在一定程度上解决了微弱蛋白点和重叠蛋白点的检测和分割,进一步提高了凝胶图像分割的准确性。RashwanS等人在2010年在传统FCM算法的基础上,为了从不同的背景中分离出更多的蛋白点引入了模糊关系概念,该方法表现出较高的性能,对于相对较弱的暗斑点也能够有效的检测出来。目前国内还没有形成对凝胶图像分割的深入研究,纵览国外的研究状况来看,各种方法都有利弊,所以我们要做的工作就是针对凝胶图像中蛋白点的特性,研究凝胶图像的分割算法,在保护图像信息和细节的同时,增强对微弱蛋白点和重叠蛋白点的识别与检测。
技术实现思路
本专利技术的目的就是为了解决上述问题,提供基于模糊聚类的凝胶蛋白分割方法,首先使用引导滤波器对图像进行滤波并增强图像对比度;然后通过模糊核C均值聚类算法对样本聚类,最后采用最大隶属度原则去模糊化,实现最优分割,在此过程中引入样本方差来计算高斯核函数径向宽度σ值,该方法具有更好的适应性和分割精度。为了实现上述目的,本专利技术采用如下技术方案:基于模糊聚类的凝胶蛋白分割方法,包括以下步骤:步骤一:对图像进行预处理,利用引导滤波器对图像进行滤波并增强图像的对比度;步骤二:初始化聚类类别数、加权指数、迭代终止阈值、最大迭代次数及初始聚类中心;步骤三:计算核函数中的径向宽度值;步骤四:更新隶属度矩阵和聚类中心;步骤五:比较当前新的聚类中心与上一次聚类中心的绝对差值是否小于迭代终止阈值,或者迭代计数器的值是否大于最大迭代次数,若成立则停止并输出最终的隶属度矩阵和聚类中心,转到步骤六继续执行;否则,迭代计数器加一后转向步骤四继续执行;步骤六:去模糊化,得到最优的分割结果。所述步骤一中,运用形态学方法增强蛋白点与背景间的对比度。所述步骤二中,从蛋白点样本数据集中任选c个不同数据分别作为初始聚类中心的c个初始聚类中心值,2≤c<n,n指聚类数据集中所有数据的个数。所述步骤二中,聚类类别数和加权指数通过赋予不同的值,进行实验测试对比效果图获得。所述步骤三中,通过计算蛋白点样本数据方差来确定高斯核函数径向宽度值。径向宽度值的计算方法具体为:其中,为蛋白点样本数据集的均值,σ为高斯核函数的径向宽度值;Σ为求和操作;n指聚类数据集中所有数据的个数;xk指第k个样本点。所述步骤四中,在约束条件下,令目标函数分别对隶属度和聚类中心求偏导数并赋值为0,从而获得隶属度和聚类中心的表达式。隶属度的计算方法为:聚类中心的计算方法为:其中,c指聚类类别数;m为加权指数;n指聚类数据集中所有数据的个数;Σ为求和操作;uik指第k个样本点属于第i类的隶属度;vi表示第i类的中心;xk指第k个样本点;K(xk,vi)指数据集中第k个样本点xk与聚类中心中第i个聚类中心值的核函数值;K(xk,vj)指数据集中第k个样本点xk与聚类中心中第j个聚类中心值的核函数值。所述步骤六中,根据最大隶属度原则去模糊化。去模糊化的具体方法为,利用隶属度函数计算出每个样本点xk隶属于第i类的值,通过比较取样本点xk最大的隶属度值,作为判定样本点属于哪一类的依据。本专利技术的有益效果:1、本专利技术提出的方法提高了消除噪声的能力,能够分离出相对较弱的蛋白点,因此分离出的蛋白点更多并且对轻度重叠蛋白点也具有较好的分离效果,具有较高的分割精度。2、给出高斯核函数径向宽度值确定方法,避免了在不同凝胶蛋白图像中通过大量实验进行人为设定的麻烦,使得聚类更具有自适应性,易于实现。附图说明图1(a)为模拟凝胶图像,图1(b)为模拟凝胶图像预处理后的凝胶图像示意图;图1(c)为对图1(b)的图像采用FCM方法分割结果,图1(d)为对图1(b)的图像采用KFCM方法分割结果,图1(e)为对图1(b)的图像采用基于距离方差分割结果,图1(f)为对图1(b)的图像采用本专利技术方法对模拟凝胶图像分割后的图像;图2(a)为真实凝胶图像,图2(b)为真实凝胶图像预处理后的凝胶图像示意图;图2(c)为对图2(b)的图像采用FCM方法分割结果,图2(d)为对图2(b)的图像采用KFCM方法分割结果,图2(e)为对图2(b)的图像采用基于距离方差分割结果,图2(f)为对图2(b)的图像采用本专利技术方法对模拟凝胶图像分割后的图像;图3模拟凝胶图像对FCM方法、KFCM方法、距离聚类、本专利技术的方法几种方法分割结果的分析比较。图4真实凝胶图像对FCM方法、KFCM方法、距离聚类、本专利技术的方法几种方法分割结果的分析比较。图5模拟和真实凝胶图像对FCM方法、KFCM方法、距离聚类、本专利技术的方法几种方法在分割精度方面的分析比较。图6专利技术的整体流程示意图。具体实施方式下面结合附图与实施例对本专利技术作进一步说明。如图6所示,基于模糊聚类的凝胶蛋白分割方法,包括以下步骤:步骤一:对图像进行预处理,首先利用引导滤波器对图像去噪处理,之后运用形态学方法增强图像对比度;步骤二:初始化聚类类别数2≤c<n,加权指数m≥1,迭代终止阈值为ε>0,最大迭代次数为100,从蛋白点样本数据集中任选c个不同数据分别作为初始聚类中心的c个初始聚类中心值,本实施例中c可以选取为2;步骤三:计算核函数中的径向宽度值;步骤四:将目标函数分别对隶属度uik和聚类中心vi求偏导数,并令偏导数为0;在约束条件下,获得隶属度和聚类中心迭代表达式;更新本文档来自技高网
...
基于模糊聚类的凝胶蛋白分割方法

【技术保护点】
基于模糊聚类的凝胶蛋白分割方法,其特征是,包括以下步骤:步骤一:对图像进行预处理,利用引导滤波器对图像进行滤波并增强图像的对比度;步骤二:初始化聚类类别数、加权指数、迭代终止阈值、最大迭代次数及初始聚类中心;步骤三:计算核函数中的径向宽度值;步骤四:更新隶属度矩阵和聚类中心;步骤五:比较当前新的聚类中心与上一次聚类中心的绝对差值是否小于迭代终止阈值,或者迭代计数器的值是否大于最大迭代次数,若成立则停止并输出最终的隶属度矩阵和聚类中心,转到步骤六继续执行;否则,迭代计数器加一后转向步骤四继续执行;步骤六:去模糊化,得到最优的分割结果。

【技术特征摘要】
1.基于模糊聚类的凝胶蛋白分割方法,其特征是,包括以下步骤:步骤一:对图像进行预处理,利用引导滤波器对图像进行滤波并增强图像的对比度;步骤二:初始化聚类类别数、加权指数、迭代终止阈值、最大迭代次数及初始聚类中心;步骤三:计算核函数中的径向宽度值;步骤四:更新隶属度矩阵和聚类中心;步骤五:比较当前新的聚类中心与上一次聚类中心的绝对差值是否小于迭代终止阈值,或者迭代计数器的值是否大于最大迭代次数,若成立则停止并输出最终的隶属度矩阵和聚类中心,转到步骤六继续执行;否则,迭代计数器加一后转向步骤四继续执行;步骤六:去模糊化,得到最优的分割结果。2.如权利要求1所述基于模糊聚类的凝胶蛋白分割方法,其特征是,所述步骤一中,运用形态学方法增强蛋白点与背景间的对比度。3.如权利要求1所述基于模糊聚类的凝胶蛋白分割方法,其特征是,所述步骤二中,从蛋白点样本数据集中任选c个不同数据分别作为初始聚类中心的c个初始聚类中心值,2≤c<n,n指聚类数据集中所有数据的个数。4.如权利要求1所述基于模糊聚类的凝胶蛋白分割方法,其特征是,所述步骤二中,聚类类别数和加权指数通过赋予不同的值,进行实验测试对比效果图获得。5.如权利要求1所述基于模糊聚类的凝胶蛋白分割方法,其特征是,所述步骤三中,通过计算蛋白点样本数据方差来确定高斯核函数径向宽度值。6.如权利要求5所述基于模糊聚类的凝胶蛋白分割方法,其特征是,径向宽度...

【专利技术属性】
技术研发人员:辛化梅张明
申请(专利权)人:山东师范大学
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1