混合模型密度设门中的邻域阈值选取制造技术

技术编号：9654212 阅读：360 留言：0更新日期：2014-02-08 17:46

本发明专利技术提供可用于在多维数据中对目标群体设门的自动设门方法，其中所述目标群体仅为所述数据中可鉴定的群体的子集。将所述群体建模为多变量概率分布的有限混合，优选正态分布或t分布。使用期望最大化(EM)算法评估为所述数据提供模型分布的最佳拟合的分布参数，期望最大化(EM)算法还包括动态邻域阈值选取，其能够实现对所述数据中存在的群簇的子集设门。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】混合模型密度设门中的邻域阈值选取
技术介绍

本专利技术总体上涉及在多维数据中定位群簇(cluster)的方法。本专利技术尤其可用于鉴定由细胞计量术，更具体地，流式细胞仪生成的数据中对应于细胞或颗粒群体的群簇。相关技术描述诸如流式细胞仪和扫描细胞仪的颗粒分析仪是众所周知的分析工具，其能实现基于诸如光散射和荧光的光学参数来表征颗粒。在流式细胞仪中，例如，在液体悬浮液中的颗粒(如分子、结合分析物的珠或个体细胞)经过检测区域，在所述检测区域中颗粒暴露于通常来自一个或多个激光器的激发光，测量颗粒的光散射和荧光性质。颗粒或其组分通常被标记有荧光染料以便于检测，通过使用光谱特性不同的荧光染料标记不同颗粒或组分，可同时检测大量不同颗粒或组分。通常，有多个光检测器，其一针对待测量的每个散射参数，其一针对待检测的每种不同染料。获得的数据包括针对每个光散射参数和荧光发射的所测量的信号。细胞仪还包括记录所测数据和分析该数据的装置。例如，通常使用连接至检测电子设备的计算机来进行数据存储和分析。数据通常以列表形式存储，其中每一行对应一个颗粒的数据，而列对应于每一测得的参数。使用标准文件形式(如“FCS”文件形式)存储来自流式细胞仪的数据可便于使用单独的程序和机器分析数据。使用当前的分析方法，所述数据通常以二维(2D)图形式展示以便于可视化，但其它方法可用于将多维数据可视化。用流式细胞仪测量的参数通常包括颗粒沿着主要向前方散射的激发光，称为前向散射(FSC)，颗粒沿着主要侧向散射的激发光，称为侧向散射(SSC)，以及在光谱的一个或多个频道(频率范围)内由荧光分子发射的光，称为FL1、...
混合模型密度设门中的邻域阈值选取

【技术保护点】
在含有至少G个群簇的p?维数据中对多个(G个)群簇进行设门的方法，其中所述数据获自对N个事件的组的测量，所述方法包括：a)使用G个p?维参数分布的混合对所述数据建模；b)提供所述p?维参数分布的参数的初始估计值；c)使用迭代期望最大化(EM)算法，估计每个所述p?维参数分布的更新的参数，其中所述EM方法包括如下步骤：i)针对每个事件，计算所述事件是每个所述参数分布的成员的后验概率，ii)确定在至少一个所述分布的邻域内的所述事件的子集I，iii)根据来自步骤i)的子集I中每个事件的后验概率，计算每个所述参数的更新的估计值，其中所述EM算法至少迭代一次；以及d)使用更新的参数估计值确定来自每个所述分布的门。

【技术特征摘要】
【国外来华专利技术】2011.03.21 US 13/053,1091.在含有至少G个群簇的p-维数据中对G个群簇进行设门的方法，其中所述数据获自对N个事件的组的测量，所述方法包括：通过处理器，使用G个p-维参数分布的混合对所述数据建模；通过处理器，提供所述p-维参数分布的参数的初始估计值；通过处理器，迭代地估计每个所述p-维参数分布的更新的参数，其中所述估计过程包括：针对每个事件，计算所述事件是每个所述参数分布的成员的后验概率，基于事件位置与各自分布的中心点的比较，确定在至少一个所述分布的邻域内的所述事件的子集，其中所述事件的鉴定出的子集中包括的事件数目少于所述组中的事件数目，以及根据对所述事件的鉴定出的子集中每个事件计算出的后验概率，计算每个p-维参数分布的每个参数的更新的估计值，其中所述估计至少迭代一次，并且其中所述后验概率的后续计算是基于所述参数的更新的估计值；以及在所述迭代估计后，通过处理器，使用更新的参数估计值确定来自每个所述分布的门。2.根据权利要求1所述的方法，其中如果来自一个分布的事件的马氏距离平方值的单调函数符合预定阈值条件，则该事件被确定为在该分布的邻域内。3.根据权利要求2所述的方法，其中所述p-维参数分布函数为p-维高斯分布。4.根据权利要求3所述的方法，其中基于来自一个分布的事件的马氏距离平方值和预定阈值的比较，确定该事件在分布函数的邻域内。5.根据权利要求2所述的方法，其中所述p-维参数分布函数为p-维t分布。6.根据权利要求5所述的方法，其中基于关于模型分布组分的事件的权重和预定阈值的比较，确定事件在分布函数的邻域内。7.根据权利要求1所述的方法，其中所述估计被迭代两次。8.根据权利要求1所述的方法，其中所述分布的中心点是基于所述分布的形状确定的。9.根据权利要求8所述的方法，其中所述形状被提供为所述分布的方差-协方差矩阵。10.用于进行计算机辅助流式细胞测量术试验的系统，所述系统包括流式细胞仪；数据存储器，所述数据存储器配置用于储存在所述流式细胞仪中进行流式...

【专利技术属性】
技术研发人员：祝远新，唐孟湘，
申请(专利权)人：贝克顿迪金森公司，
类型：
国别省市：

全部详细技术资料下载我是这个专利的主人