一种仿射传播聚类的细胞分类方法技术

技术编号:4012353 阅读:275 留言:0更新日期:2012-04-11 18:40
一种仿射传播聚类的细胞分类方法,包括以下步骤:1)选取细胞图像的圆形度参数C和矩形度参数R,设计样本坐标Xsample=λ.C+(1-λ).R,其中λ代表先验输入值;选取细胞图像的面积参数Area作为另一样本坐标Ysample,选取细胞图像的核质比参数prop作为再一样本坐标Zsample;2)以所述三维的样本坐标的欧式距离作为样本距离,仿射传播聚类的S矩阵的对角线取值为各个样本间距离的平均;3)初始情况下,设置归属度矩阵A(i,k)=0,更新矩阵R,更新矩阵A;4)在迭代设定次数后停止,从分类结果得到不同类型的细胞。本发明专利技术提供一种适合于处理海量数据、实时性良好、能有效进行细胞分类的仿射传播聚类的细胞分类方法。

【技术实现步骤摘要】

本专利技术涉及图像处理、生物医学、计算机视觉、计算方法,尤其是一种针对细胞图 像分割后的细胞分类方法。
技术介绍
细胞图像的分割目的是提取出细胞体,在成功分割出细胞体后,可以将图像信息 转换成数值量,也就是本文第四章完成的工作。尽管不同的分割方法分割效果大相径庭,但 都能获得细胞单体,之后完成细胞单体转换成数字统计量,也就是形态参数。大部分研究成 果只提出了分割的思想或统计形态参数,致使研究学者必须面对海量的数据,增加了研究 难度和分析时间。商业细胞形态分析软件——IMT组织形态学分析软件,对于细胞形态参数的分析 也仅停留在参数统计阶段。首先该软件对于分割效果来说并不理想,没有分割出全部的目 标体。其次,更没有给出如何分类细胞。在此错误结果上完成的细胞统计,对于研究者来说 的意义聊胜于无。传统的细胞形态分析方法存在的缺陷1、面对海量数据,实时性差、计算复杂度 高;2、无法进行细胞分类。
技术实现思路
为了克服已有的细胞形态分析方法的计算复杂度高、实时性差、无法进行细胞分 类的不足,本专利技术提供一种适合于处理海量数据、实时性良好、能有效进行细胞分类的仿射 传播聚类的细胞分类方法。本专利技术解决其技术问题所采用的技术方案是—种仿射传播聚类的细胞分类方法,所述细胞分类方法包括以下步骤1)、选取细胞图像的圆形度参数C和矩形度参数R,设计样本坐标Xsample = 入 c+(l-x) *R,其中入代表先验输入值;选取细胞图像的面积参数Area作为另一样本 坐标Ysample,选取细胞图像的核质比参数prop作为再一样本坐标Zsample ;2)、以所述三维的样本坐标的欧式距离作为样本距离,对于样本点Xi和xk,i兴k, S(i,k) = -| Xi-Xk| |2,仿射传播聚类的S矩阵的对角线取值为各个样本间距离的平均值;3)、初始情况下,设置归属度矩阵A(i,k) = 0,更新矩阵R,R(i,k) = S(i, k)-max{A(i, k ' )+S(i,k' )},其中 k'乒 k ;更新矩阵 A, A(i,k) = min{0,R(k, k)+Emax{0, R(i',k)}},其中i'兴i,k ;(注R(i,k)描述数据点k适合作为样本点i 的聚类中心的程度;A(i,k)描述样本点i选择样本点k作为其聚类中心的适合程度;i'为 更新的样本点,k'为竞争聚类中心);4)、在迭代设定次数后停止,从分类结果得到不同类型的细胞。进一步,所述步骤4)中,在同一类型的细胞中选出聚类中心,所述聚类中心对应 的细胞为具有代表性的形态参数的典型细胞。本专利技术的技术构思为仿射传播(Affinity Propagation)是近期提出的一种先 进快速的聚类算法。仿射传播将各个样本间的相似度用实数表示,N个样本的相似度矩阵S 为NXN,其中元素S(i,k)表示点k被选择作为点i的聚类点的倾向度。对于样本点,S(i, k)的取值理解为样本距离,在欧式空间中,对于空间内的两点,欧氏距离可以当作两样本间 的样本距离。由于聚类的目的是使方差最小化,因此对于点xjPxk,s(i,k) =-| Xi-Xk| |2。将负的两个点之间距离设想为吸引度或归属度,则点k对较近的点i吸引力比较 大,同样点i认同点k为其聚类中心的归属度也较大。这样,处于聚类中心处的数据点k对 其他数据点的吸引力之和较大,成为聚类中心的可能性也越大;反之,处于聚类边缘处的数 据点对其他数据点的吸引力之和比较小,成为聚类中心的可能性也越小。由此可知,仿射聚类算法为选出合适的聚类中心而不断从样本数据中搜集累积的 证据为候选聚类中心点k从每个样本点i搜集证据R(i,k)来描述数据点k适合作为样 本点i的聚类中心的程度,也为样本点i从候选聚类中心点k搜集证据A(i,k)(称为点i 对点k的归属度)来描述样本点i选择样本点k作为其聚类中心的适合程度。累积证据越 强,即R(i,k)与A(i,k)越大,样本点k作为最终聚类中心的可能性就越大。仿射聚类算法流程如下 1、设置相似度矩阵S,对角线上的值代表该点作为潜在聚类中心的可能性,该值越 大,说明该点被选择聚类中心的倾向度越大。2、初始情况下,设置归属度矩阵A(i,k) = 0。3、更新矩阵 其中 k'乒 k。4、更新矩阵 A, 后,停止。各个样本点发送的信息如图1所示。为了直观地验证仿射传播聚类在处理大类数据时良好的分类能力。对于100个落 在区间x G 和y G 的随机数,如图2所示。对于这空间中的100个数据,空间坐标是唯一可以作为样本距离的参数。定义 s(i, k) =-| Xi-Xk| |2,其中\和 分别为点i和点k的空间坐标。S矩阵的对角线坐标 各个s(i,k)的均值,其中i兴k。图3为输出样本及聚类中心的示意图。输出结果的耗时 和迭代次数 该仿射传播聚类对处理大量无规则数据时分类效果较好且耗时少,符合系统实时 性的要求。本专利技术的有益效果主要表现在适合于处理海量数据、实时性良好、能有效进行细 胞分类。附图说明图1是仿射传播聚类的样本间发送信息的示意图。图2是100各随机数的示意图。4图3是聚类中心的示意图。 具体实施例方式下面结合附图对本专利技术作进一步描述。参照图1 图3,,所述细胞分类方法包括以下 步骤1)、选取细胞图像的圆形度参数C和矩形度参数R,设计样本坐标Xsample = 入 c+(l-x) *R,其中入代表先验输入值;选取细胞图像的面积参数Area作为另一样本 坐标Ysample,选取细胞图像的核质比参数prop作为再一样本坐标Zsample ;2)、以所述三维的样本坐标的欧式距离作为样本距离,对于样本点Xi和xk,i兴k, S(i,k) = -| Xi-Xk| |2,仿射传播聚类的S矩阵的对角线取值为各个样本间距离的平均值;3)、初始情况下,设置归属度矩阵A(i,k) = 0,更新矩阵R,R(i,k) = S(i, k)-max{A(i, k ' )+S(i,k' )},其中k'乒 k ;更新矩阵 A, A(i,k) = min{0,R(k, k)+Emax{0, R(i',k)}},其中i'兴i,k ;(注R(i,k)描述数据点k适合作为样本点i 的聚类中心的程度;A(i,k)描述样本点i选择样本点k作为其聚类中心的适合程度;i'为 更新的样本点,k'为竞争聚类中心);4)、在迭代设定次数后停止,从分类结果得到不同类型的细胞。所述步骤4)中,在同一类型的细胞中选出聚类中心,所述聚类中心对应的细胞为 具有代表性的形态参数的典型细胞。本实施例中,作为样本的多个参数,细胞图像的形态参数周长、面积、高度、宽度 分别为绝对数值,圆形度、矩形度、伸长度、核质比分别为相对参数。如果要区分细胞的种 类,相对参数比绝对参数更具有代表性,更能体现出细胞的整体轮廓特征,但是在某些情况 下,如果细胞大小是重要参考参数的时候,绝对参数就比相对参数更有区分度。综上所述, 由于本文的分割模型侧重分割细节,绝对参数对于本文来说具有重要参考意义。同时,本文 提出的核质比参数也是研究细胞生理状态的重要参数,因此本节给出的细胞分类策略结合 绝对参数和相对参数,设计样本间的距离如下对于相对参数,选取圆形度参数C和矩形度参数R,设计样本坐标Xsam本文档来自技高网...

【技术保护点】
一种仿射传播聚类的细胞分类方法,其特征在于:所述细胞分类方法包括以下步骤:1)、选取细胞图像的圆形度参数C和矩形度参数R,设计样本坐标X↓[sample]=λ.C+(1-λ).R,其中λ代表先验输入值;选取细胞图像的面积参数Area作为另一样本坐标Y↓[sample],选取细胞图像的核质比参数prop作为再一样本坐标Z↓[sample];2)、以所述三维的样本坐标的欧式距离作为样本距离,对于样本点x↓[i]和x↓[k],S(i,k)=-||x↓[i]-x↓[k]||↑[2],仿射传播聚类的S矩阵的对角线取值为各个样本间距离的平均值;3)、初始情况下,设置归属度矩阵A(i,k)=0,更新矩阵R,R(i,k)=S(i,k)-max{A(i,k′)+S(i,k′)},其中k′≠k;更新矩阵A,A(i,k)=min{0,R(k,k)+∑max{0,R(i′,k)}},其中i′≠i,k,注:R(i,k)描述数据点k适合作为样本点i的聚类中心的程度;A(i,k)描述样本点i选择样本点k作为其聚类中心的适合程度;i′为更新的样本点,k′为竞争聚类中心)4)、在迭代设定次数后停止,从分类结果得到不同类型的细胞。...

【技术特征摘要】

【专利技术属性】
技术研发人员:陈胜勇陈敏姚春燕赵明珠柳刚锋张厚祥张建伟
申请(专利权)人:浙江工业大学
类型:发明
国别省市:86[中国|杭州]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1