【技术实现步骤摘要】
一种微液滴数据的分类方法
本专利技术涉及微液滴
,尤其涉及一种微液滴数据的分类方法。
技术介绍
微液滴技术能将传统的反应体系均匀地分割为几百到几百万个微反应器(常用的规模为几万到几百万个微反应器)中,从而实现高通量的单分子分析,在罕见分子的检测和分子数的绝对定量等领域有着广泛的应用,包括微液滴数字聚合酶链式反应、微液滴数字酶联免疫吸附反应和基于微液滴的高通量单细胞分析等。由于每个微液滴在检测过程中都会产生一个n维向量,其每一维往往对应于一个荧光通道。在每一次反应结束后,就会得到几百到几百万的个数据点(其中每一个称为微液滴数据的一个成员)。样品中目标分子的数量一般对应于在某些荧光维度具有较高荧光值的数据点数,因此需要自动、客观、准确地界定哪些微液滴数据的成员具有较高荧光值。为了实现自动、客观、准确的微液滴数据判读,研究者们想了许多分类方法。这些分类方法可以分为监督或非监督两类。监督分类算法需要使用现有的微液滴数据进行学习。Milbury等提出,可以使用现有微液滴数据划定二维区域(比如EGFR的T790和L ...
【技术保护点】
1.一种微液滴数据的分类方法,其特征在于,所述方法包括以下步骤:/n步骤1:输入微液滴数据和微液滴的分类形态参数,所述微液滴数据由多个数据成员组成,其中每一个所述数据成员的维数相同,或者经过变换后每一个所述数据成员的维数相同,所述分类形态参数为微液滴分类的微液滴的数量参数和相对位置参数;/n步骤2:将所述微液滴数据划分成网格,所有网格构成网格图谱;/n步骤3:按照每个网格内的微液滴数据密度差异,将所述网格图谱分为至少一个区域,其中所述网格内的微液滴数据密度为所述网格内的微液滴数据成员个数,或者该数据成员个数经过变换后的数值;/n步骤4:根据所述分类形态参数设置基准点组合,并 ...
【技术特征摘要】
1.一种微液滴数据的分类方法,其特征在于,所述方法包括以下步骤:
步骤1:输入微液滴数据和微液滴的分类形态参数,所述微液滴数据由多个数据成员组成,其中每一个所述数据成员的维数相同,或者经过变换后每一个所述数据成员的维数相同,所述分类形态参数为微液滴分类的微液滴的数量参数和相对位置参数;
步骤2:将所述微液滴数据划分成网格,所有网格构成网格图谱;
步骤3:按照每个网格内的微液滴数据密度差异,将所述网格图谱分为至少一个区域,其中所述网格内的微液滴数据密度为所述网格内的微液滴数据成员个数,或者该数据成员个数经过变换后的数值;
步骤4:根据所述分类形态参数设置基准点组合,并与每个所述区域的中心比对,确定最优分类形态参数,其中所述基准点组合满足以下条件:第一,任意两个所述基准点之间的相对位置为分类形态参数中的一种相对位置参数;第二,所述基准点组合中的基准点数量不超过分类形态参数的数量参数;
步骤5:按照所述区域数量对微液滴数据进行分类,如果在步骤3中所述区域的数量不大于步骤4中所述最优分类形态参数的数量参数,则直接按照所述区域对微液滴数据进行分类;如果步骤3完成后中所述区域的数量大于步骤4中所述最优分类形态参数的数量参数,则对步骤3完成后的区域进行挑选和/或合并,直到挑选和/或合并后的区域数量不超过步骤4中所述最优分类形态参数的数量参数,然后按照挑选和/或合并后的区域对微液滴数据进行分类。
2.根据权利要求1所述的方法,其特征在于,步骤1所述的分类形态参数为微液滴的给定行数和列数、位于等间隔棋盘分布格点上的分类形态参数,其中所述格点的数量为所述分类形态参数的数量参数,所述格点之间的相对位置为所述分类形态参数的相对位置参数。
3.根据权利要求1所述的方法,其特征在于,步骤2所述的网格为棋盘网格,优选地为满足下列条件的棋盘网格:第一,所述棋盘网格每一维内的网格边长相同;第二,所述网格图谱的各个边界由所述微液滴数据在每一维的最大值和最小值决定;第三,所述棋盘网格每一维的划分数为给定正整数常量或随所述微液滴数据在该维上投影的不同数值的个数递增,优选地为所述微液滴数据在该维上投影的不同数值个数的对数,并向上取整。
4.根据权利要求1所述的方法,其特征在于,将所述网格图谱分为至少一个区域的方法为:如果网格图谱内存在唯一的峰值网格,则所述网格图谱分为一个区域,否则寻找至少一个边界网格,使得称为内部网格的剩余网格分为满足以下条件的多个区域:第一,非邻接的峰值网格分别为不同区域的内部网格,第二,边界网格内数据密度的总和最小,其中峰值网格指的是一个网格内的数据密度不小于其任意一个邻接网格内的数据密度的网格;所述方法优选地为:所述网格内的数据密度为所述微液滴数据成员的个数,先对取每个网格内数据密度的相反数,然后使用分水岭算法将网格分类为区域。
5.根据权利要求1所述的分割方法,其特征在于,步骤4所述的最优分类形态参数的确定方法为:依次考察可能的基准点组合,并计算每个区域的中心到其中最近基准点的距离,然后按每个区域内的数据成员数量加权后求和,称为最近距离总和,最后选取最近距离总和最小的基准点组合作为最优分类形态参数,其数量参数为所选取的基准点组合中基准点的数量,其相对位置参数为所选取的基准点组合中可能的相对位置。
6.根据权利要求1所述的方法,其特征在于,步骤5所述的合并可以通过如下方法进行:计算邻接区...
【专利技术属性】
技术研发人员:朱修锐,郭永,荆高山,祝令香,苏世圣,付明珠,王勇斗,
申请(专利权)人:北京新羿生物科技有限公司,北京天健惠康生物科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。