当前位置: 首页 > 专利查询>苏州大学专利>正文

基于粒子群优化的K-means聚类算法的基因芯片图像分割法制造技术

技术编号:4063522 阅读:467 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种基于粒子群优化的K-means聚类算法的基因芯片图像分割法,其特征为,首先根据K-means聚类算法基因芯片图像的所有像素分为K类,粒子群中的每个粒子根据适应度函数搜寻局部最优位置;然后粒子群中的粒子根据其个体极值和最优位置更新自己的速度和位置值。经过多次迭代之后,全局最优位置所在的子群即为聚类分类结果。本发明专利技术算法过程简单清晰,有效避免陷入局部最优或者产生空类的情形,收敛速度快,搜索全局最优能力强,需要设置和调整的参数少,分类结果准确而快速,不受人为因素干扰,适用于大规模的基因芯片图像分割。

【技术实现步骤摘要】

本专利技术涉及一种图像的分割处理方法,具体涉及一种利用粒子群优化的K-means 聚类算法对基因芯片图像进行自动分割的方法。
技术介绍
基因芯片(又称DNA芯片或者生物芯片),是上世纪80年代中期发展起来的一种 新型实用的生物技术,目前已成为国际生命科学研究的热点之一。基因芯片技术基于杂交 原理,结合半导体工业的微型制造技术和分子生物学技术,将数量巨大的寡核苷酸或cDNA 作为探针,通过高速机器人点样的方式,以一定的顺序或排列方式固定在一块面积极小的 硅片、玻片或尼龙膜等基片上,经荧光标记的样本与芯片上的DNA序列按碱基配对原理杂 交后,利用激光共聚焦荧光检测系统得到荧光信号,不同样本中荧光信号的强度反应了样 本中mRNA的表达水平。通过处理和分析基因芯片杂交检测图像,可以对生物细胞或者组织 中大量的基因信息进行分析。该技术具有高度的并行性、多样性、微型性和自动化等优点, 能够在很短时间内分析大量的生物分子,并快速准确地获取样品中的生物信息,从而大大 提高了检测效率。基因芯片技术已成为高效、快速、大规模获取相关生物信息的重要手段。研究人员在对图像的研究和应用过程中,往往只对图像中的某些部分感兴趣(一 般对应图像中特定的、具有独特性质的区域),这部分区域通常称之为目标或前景,其它部 分称之为背景。只有在图像分割的基础上才能对目标进行特征提取和参数测量,使得更高 层的图像分析和理解成为可能。基因芯片的图像分割处理是基因芯片应用过程中一个重要的步骤,基因芯片图像 分割的过程就是确定目标信号(靶点)与背景信号的过程,也就是在背景中识别出靶点信 号的过程,其目的是要在图像中提取靶点的亮度信息,以供研究人员进一步的探索和研究。 该过程的分析结果将直接用于确定检测的结果和后续的研究。目前,国内外已经出现了一 些专门用于处理和分析基因芯片图像的软件产品,但是大多需要人工参与,并且存在分析 精度达不到要求等缺点。聚类分析在模式识别和图像处理领域中具有广泛的应用,其主要目的是按事物 间的相似性对给定事物进行区分和分类,使每一类中的元素尽可能具有相同的特性,不同 聚合类之间的特性差别尽可能的大。图像分割和对象提取是聚类分析的主要应用方面。 K-means聚类算法(J. B. MacQueen,1967)作为聚类算法的中最简单,最快速的一种,有着大 量而广泛的使用。在实际应用中发现,K-means聚类算法有着很明显的特点。由于计算方法的特点, K-means聚类算法在大数据量时的扩展性和效率都较理想,适用于基因芯片的图像分割处 理。但在类中心的初始化时,若选择不当,有可能会陷入局部最优或者产生空类的情况。同 时,对于不同的初始化可能会产生不同的聚类结果,不利于聚类结果的分析与使用。此外, K-means聚类算法受到噪声和异常数的影响较大。
技术实现思路
本专利技术目的是提供一种基于粒子群优化的K-means聚类算法的基因芯片图像分 割法,通过引入粒子群算法优化,获得一种设置参数少、受噪声影响小的图像分割方法,有 利于基因芯片的图像分割处理。为达到上述目的,本专利技术首先根据K-means聚类算法基因芯片图像的所有像素分 为K类,粒子群中的每个粒子根据适应度函数搜寻局部最优位置;然后粒子群中的粒子根 据其个体极值和最优位置更新自己的速度和位置值。经过多次迭代之后,全局最优位置所 在子群所产生的即为聚类分类结果。该算法通过对粒子群的聚类,使粒子之间的信息得以 交换,并利用了更多粒子在迭代寻优过程中包含的信息,算法的全局收敛性更强。具体采用的技术方案是一种基于粒子群优化的K-means聚类算法的基因芯片图 像分割法,包括下列步骤(1)输入基因芯片图像,并对基因芯片图像进行预处理;所述预处理包括,将基因芯片图像转化为单色灰度图像,通过数学形态学的方法 对该单色灰度图像进行滤波处理,将连通部分少于η个像素的图像部分滤去,其中,η取 15 50之间的整数;(2)对步骤⑴处理后的图像进行网格定位,获得多个基因芯片图像靶区,每一图 像靶区由网格定位后的一个靶点及其背景区域构成;(3)分别对每一图像靶区进行图像分割处理,所述图像分割处理为,一个像素由一 个数据矢量表示,数据矢量的横坐标与纵坐标对应像素点的横坐标与纵坐标,数据矢量值 对应像素点的灰度值,对数据矢量的划分采用基于粒子群优化的K-means聚类算法进行, 最终将所有像素划分为目标与背景两类,实现基因芯片图像的分割;所述基于粒子群优化 的K-means聚类算法是,首先根据K-means聚类算法将基因芯片图像的所有像素分为K类, K = 2,粒子群中的每个粒子根据适应度函数搜寻局部最优位置;然后粒子群中的粒子根据 其个体极值和最优位置更新自己的速度和位置值;经过多次迭代之后,全局最优位置所在 的子群即为聚类分类结果。上述技术方案中,一个粒子i表示基因芯片图像分割的一个潜在的解,解的优劣 程度由适应度函数来衡量。每个粒子i都包含如下的信息Xi(t)为粒子的当前位置;Vi(t) 为粒子的当前飞行速度,即粒子移动的距离;Yi (t)为粒子的个体最优位置。一个粒子的个 体最优位置是粒子迄今为止搜索到的最优位置,也就是能产生最大的适应度值。所述的粒子群优化的K-means聚类算法步骤如下1)初始化设定好粒子数N及最大迭代次数tmax,随机生成每个粒子的位置向量 Xi (t)和速度向量Vi(t),随机生成聚类中心mic;,i = 1,2,…,N,聚类数设置为K,所以C = 1,…,K;2)对每个粒子i,做下列运算a)计算像素点zp (zp为待分割图像的像素点灰度值矢量)到其聚类中心叫。的欧氏距离 ,按最小距离原则 将像素点重新分配至各个聚类Cij,j = 1,-,K;类Cij按照二+ Σ zP计算聚类中b)各个聚类Ci1按照m^ 二了 L· zP计算聚类中心叫。,…为属于聚类Ci1的像素 Vzp eC"点个数;c)计算适应度函数/(m,,,Z) = ^Jmax(Z5Iiiic) + ^(Zmax -dmm(mic));3)计算此时局部最优位置yA + lhminfyA + lhVO和 全局最优位置 yg(i + l) = min{y/(i + l),Vi},其中⑴ if /(x,(i + i))>/(y,(0) y'(i + 1) = |x,(i + l) if/(x;.(i + l))</(y,.(0) 54)根据 Vi (t+1) = ω Vi (t) +C^1 (t) (Yl (t) -Xi (t)) +c2r2 (t) (yg (t) -Xi (t))更新粒子 的速度,若 Vi(t+1) > Vma!^lJVi(t+l) =Vmax ;然后根据 Xi (t+1) = Xi (t)+Vi (t+1)对更新粒 子的位置;步骤2)、3)、4)循环tmax次,全局最优位置yg(t)所在子群所产生的聚类分类结果 即为最终结果。上述技术方案中,所述的每个粒子根据适应度函数搜寻局部最优位置,对每个粒 子的优劣程度由如下适应度函数确定/(m,c,Z) = ^y1Jmax (Z,mic) + (zmax - dmm (m;c))其中,Zfflax为图像灰度值矢量中最大的像素灰度值;Z为显本文档来自技高网
...

【技术保护点】
一种基于粒子群优化的K-means聚类算法的基因芯片图像分割法,其特征在于,包括下列步骤:(1)输入基因芯片图像,并对基因芯片图像进行预处理;(2)对步骤(1)处理后的图像进行网格定位,获得多个基因芯片图像靶区,每一图像靶区由网格定位后的一个靶点及其背景区域构成;(3)分别对每一图像靶区进行图像分割处理,所述图像分割处理为,一个像素点由一个数据矢量表示,数据矢量的横坐标与纵坐标对应像素点的横坐标与纵坐标,数据矢量值对应像素点的灰度值,对数据矢量的划分采用基于粒子群优化的K-means聚类算法进行,最终将所有像素划分为目标与背景两类,实现基因芯片图像的分割;所述基于粒子群优化的K-means聚类算法是,首先根据K-means聚类算法将基因芯片图像的所有像素分为K类,K=2,粒子群中的每个粒子根据适应度函数搜寻局部最优位置;然后粒子群中的粒子根据其个体极值和最优位置更新自己的速度和位置值;经过多次迭代之后,全局最优位置所在的子群即为聚类分类结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:胡益军翁桂荣
申请(专利权)人:苏州大学
类型:发明
国别省市:32[中国|江苏]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1