一种实现大脑白质快速分割和纤维簇数据分析的方法技术

技术编号:13835064 阅读:62 留言:0更新日期:2016-10-15 14:44
本发明专利技术公开了一种实现大脑白质快速分割和纤维簇数据分析的方法,本发明专利技术将全部纤维距离数据问题替换为近邻纤维距离数据从而实现算法加速,其中寻找近邻纤维采用二叉树的方法,进而使纤维密度ρ和因子dc的计算量明显降低,解决了现有技术耗时相对较长的问题,但是很好地保证了分类准确率。

【技术实现步骤摘要】

本专利技术属于医学图像处理领域,涉及大脑纤维簇的聚类处理和数据分析,特别涉及到一种基于密度峰值的大脑纤维簇快速聚类的方法。
技术介绍
纤维簇聚类是医学图像处理研究领域中的一个必不可少的环节,也是让医学图像分析变得更加便捷的一项重要的技术。大脑中不同结构的纤维簇对应着不同的功能,医学上的分析也对应有所差异。一个可以实现正确分割纤维簇并将不同结构的纤维簇归类区分的聚类算法是后续医学上正确分析对应功能的基础和保证。目前聚类算法领域内已经有了很多效果很好的算法,比如K-means、GMM、mean-shift。K-means作为一个最基础最经典的聚类方法,快速而简单并且对大数据集有较高的效率和可伸缩性;GMM和K-means的迭代求解法其实非常相似,GMM所得的结果不仅仅是数据点的类标签,还包含了数据点标记为每个类标签的概率,很多时候这实际上是非常有用的信息;mean-shift计算量不是很大,聚类的效果也还不错。然而以上三种聚类方法用于神经纤维聚类时,由于纤维相似度测量标准的特殊性致使效果都不好。目前研究发现基于密度峰值的聚类算法density-peaks clustering用于纤维分类时能够很好地分割出不同类的纤维簇,但是利用该算法在计算相关数值时需要用到每条纤维与其他纤维间的距离值,由此导致算法计算量过大。我们在研究过程中发现,如果只选取纤维的一定数量的近邻参与运算则可以大幅度减小运算量,于是我们提出并实现了与density-peaks clustering算法效果几乎一致但却计算更快的加速算法Fast density-peaks clustering。
技术实现思路
为了克服现有技术的耗时相对较长的问题,本专利技术提出了一种实现大脑白质快速分割和纤维簇数据分析的方法。本专利技术提供了一种实现大脑白质快速分割和纤维簇数据分析的方法,包括:步骤100,大脑纤维簇数据预处理,利用现有的医学图像处理工具将大脑三维图像数据转化为tensor图像,在tensor图像中标注出需要进行聚类和分割的大脑纤维簇,并将每条纤维均分为p-1段,找出相应的p个节点,记录这p个节点位置,作为该纤维的表示,即将纤维离散化表示成f=(x1,x2,...,xp-1,xp)。步骤200,对步骤100所得的纤维数据进行纤维的聚类和分割,包括以下过程:步骤201,计算每两条纤维之间的距离得到距离矩阵distMat;步骤202,找到每条纤维的K近邻;步骤203,计算dc因子;步骤204,计算每条纤维的密度,作为该纤维的一个描述子;步骤205,将纤维按密度值降序排列,在比纤维i密度高的纤维中选取与纤维i距离最近的纤维,记录下该纤维的序号,并将相应的最小距离值作为纤维i的另一个描述子δ;步骤206,选取聚类中心;步骤207,对纤维进行分类;步骤208,根据类中各纤维的密度值设定对应类中的边界密度值,假设类中有m个不同的密度值,将类中所有纤维的密度值按升序排列,选取第(5%*m)个值作为该类的边界纤维密度,,类中低于边界密度值的纤维被设定为异常值。所述步骤201,计算每两条纤维之间的距离得到距离矩阵distMat,包括:纤维fa=(x1,x2,...,xp-1,xp)和纤维fb=(y1,y2,...,yp-1,yp)之间的距离计算公式为 d ( f a , f b ) = m i n ( | | f a - f b | | 2 , | | f a - f ‾ b | | 2 ) , ]]>其中所述步骤202,找到每条纤维的K近邻,包括:首先,将计算得到的某条纤维i与其他纤维之间的距离值组合成数据集A,找到A中数据的中位数或者均值mean1,A中小于mean1的放到数据集B中;其次,用上述方法持续对左树数据集进行二分直到循环结束后的左树数中数据量为n/8个,其中n为纤维总数,此时左树的K数据集存储的数据是纤维距离数值中最小的前1/8个数据;最后从i纤维的n/8个数据找到i纤维的K近邻。所述步骤203,计算dc因子,包括:首先,将计算得到的纤维之间的距离值组合成数据集A,找到A中数据的中位数或者均值mean1,A中小于mean1的放到数据集B中;其次,用上述方法持续对左树数据集进行二分直到循环结束后的左树中数据量n/8个,;此时左树的K数据集存储的数据是纤维距离数值中最小的前1/8个数据;最后将得到的K数据集中的数据进行升序排列取排序后的第(1%*n)或者(2%*n)个值赋给dc,其中n表示纤维条总数。所述步骤204,计算每条纤维的密度,作为该纤维的一个描述子,包括:利用步骤202和步骤203得到的每条纤维的K近邻和dc值,计算每条纤维的密度ρ,具体计算公式为所述步骤206,选取聚类中心,包括:计算得到的ρ和δ绘制决策图,选取ρ和δ都相对较大的点作为聚类中心,带圆圈标记的浅色点即为选中的聚类中心,对应三类纤维LFO、Fmajor和ILF。所述步骤207,对纤维进行分类,包括:按密度ρ对纤维进行降序排列,依次将每条纤维分配到密度比他大且距离他最近的纤维所属的类别里去。有益效果:本专利技术将全部纤维距离数据问题替换为近邻纤维距离数据从而实现算法加速,其中寻找近邻纤维采用二叉树的方法,进而使纤维密度ρ和因子dc的计算量明显降低,解决了现有技术耗时相对较长的问题,但是很好地保证了分类准确率。附图说明图1为将纤维归一化表示和挑选p个节点的方法图示。图2纤维的两种表示方法图示。图3是本专利技术寻找某纤维近邻的方法图解。图4是用本专利技术计算ρ和δ之后所得的纤维簇决策树图。图5是对应人工标记的分类结果展示。图6为依据本专利技术分类结果分割完成的纤维簇图示。具体实施方式为使本专利技术解决的技术问题、采用的技术方案和达到的技术效果更加清楚,下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部内容。本专利技术的原理如下:步骤1.大脑纤维簇数据预处理。利用现有的医学图像处理工具(例如:Mricron、DTIstudio、FSL、DiffeoMap)将大脑纤维簇数据变换成能参与聚类运算的表现形式,即将每条纤维均分为(p-1)段,找出p个节点,记录这p个节点位置,作为该纤维的表示(即用纤维上的p个点来表示一条纤维,将纤维离散化)。步骤2.分割(用我们提出的Fast本文档来自技高网
...

【技术保护点】
一种实现大脑白质快速分割和纤维簇数据分析的方法,其特征在于,所述实现大脑白质快速分割和纤维簇数据分析的方法包括:步骤100,大脑纤维簇数据预处理,利用现有的医学图像处理工具将大脑三维图像数据转化为tensor图像,在tensor图像中标注出需要进行聚类和分割的大脑纤维簇,并将每条纤维均分为p‑1段,找出相应的p个节点,记录这p个节点位置,作为该纤维的表示,即将纤维离散化表示成f=(x1,x2,...,xp‑1,xp);步骤200,对步骤100所得的纤维数据进行纤维的聚类和分割,包括以下过程:步骤201,计算每两条纤维之间的距离得到距离矩阵distMat;步骤202,找到每条纤维的K近邻;步骤203,计算dc因子;步骤204,计算每条纤维的密度,作为该纤维的一个描述子;步骤205,将纤维按密度值降序排列,在比纤维i密度高的纤维中选取与纤维i距离最近的纤维,记录下该纤维的序号,并将相应的最小距离值作为纤维i的另一个描述子δ;步骤206,选取聚类中心;步骤207,对纤维进行分类;步骤208,根据类中各纤维的密度值设定对应类中的边界密度值,假设类中有m个不同的密度值,将类中所有纤维的密度值按升序排列,选取第(5%*m)个值作为该类的边界纤维密度,类中低于边界密度值的纤维被设定为异常值。...

【技术特征摘要】
1.一种实现大脑白质快速分割和纤维簇数据分析的方法,其特征在于,所述实现大脑白质快速分割和纤维簇数据分析的方法包括:步骤100,大脑纤维簇数据预处理,利用现有的医学图像处理工具将大脑三维图像数据转化为tensor图像,在tensor图像中标注出需要进行聚类和分割的大脑纤维簇,并将每条纤维均分为p-1段,找出相应的p个节点,记录这p个节点位置,作为该纤维的表示,即将纤维离散化表示成f=(x1,x2,...,xp-1,xp);步骤200,对步骤100所得的纤维数据进行纤维的聚类和分割,包括以下过程:步骤201,计算每两条纤维之间的距离得到距离矩阵distMat;步骤202,找到每条纤维的K近邻;步骤203,计算dc因子;步骤204,计算每条纤维的密度,作为该纤维的一个描述子;步骤205,将纤维按密度值降序排列,在比纤维i密度高的纤维中选取与纤维i距离最近的纤维,记录下该纤维的序号,并将相应的最小距离值作为纤维i的另一个描述子δ;步骤206,选取聚类中心;步骤207,对纤维进行分类;步骤208,根据类中各纤维的密度值设定对应类中的边界密度值,假设类中有m个不同的密度值,将类中所有纤维的密度值按升序排列,选取第(5%*m)个值作为该类的边界纤维密度,类中低于边界密度值的纤维被设定为异常值。2.根据权利要求1所述的实现大脑白质快速分割和纤维簇数据分析的方法,其特征在于,步骤201,计算每两条纤维之间的距离得到距离矩阵distMat,包括:纤维fa=(x1,x2,...,xp-1,xp)和纤维fb=(y1,y2,...,yp-1,yp)之间的距离计算公式为 d ( f a , f b ) = m i n ( | | f a - f b | | 2 , | | f a - f ‾ b | | ...

【专利技术属性】
技术研发人员:樊鑫罗钟铉程世超段煜茁王倩
申请(专利权)人:大连理工大学
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1