【技术实现步骤摘要】
【国外来华专利技术】与相关申请的交叉引用本申请要求2014年2月25日提交的美国临时申请号61/944,465和2015年1月8日提交的美国临时申请号62/101,291的权益,所述临时申请各自以其全部内容通过参考并入本文。本申请涉及2013年2月20日提交的美国临时申请号61/767,219和2014年2月19日提交的PCT申请号PCT/US2014/017226,其各自以其全部内容通过参考并入本文。专利技术概述在某些实施方式中,提供了一种表征样品的方法。所述方法可以包括使用第一标记物标记多个样品分子,其中所述样品分子包含基因组或基因组片段。所述方法可以包括通过流体通道转移多个标记的样品分子。所述方法可以包括检测来自于所述标记的样品分子的信号的计数,以便确定所述基因组或基因组片段特征性的模式或多个模式。所述方法可以包括将来自于所述标记的样品分子的信号与参比物相关联,以确定所述样品分子对所述基因组或基因组片段的一个或多个区域的覆盖。所述方法可以包括将所述信号的覆盖深度针对不包含性染色体或其片段的所述基因组或基因组片段的区域所对应的信号的覆盖深度的子集进行缩放,由此提供缩放的覆盖深度。所 ...
【技术保护点】
一种表征样品的方法,所述方法包括:使用第一标记物标记多个样品分子,其中所述样品分子包含基因组或基因组片段;通过流体通道转移多个标记的样品分子;检测来自于所述标记的样品分子的信号的计数,以便确定所述基因组或基因组片段特征性的模式或多个模式;将来自于所述标记的样品分子的信号与参比物相关联,以确定所述样品分子对所述基因组或基因组片段的一个或多个区域的覆盖;将所述信号的覆盖深度针对不包含性染色体或其片段的所述基因组或基因组片段的区域所对应的信号的覆盖深度的子集进行缩放,由此提供缩放的覆盖深度;并且通过下述一者、两者或三者对所述缩放的覆盖深度进行归一化:所述多个标记的样品分子的特征性 ...
【技术特征摘要】
【国外来华专利技术】2014.02.25 US 61/944,465;2015.01.08 US 62/101,2911.一种表征样品的方法,所述方法包括:使用第一标记物标记多个样品分子,其中所述样品分子包含基因组或基因组片段;通过流体通道转移多个标记的样品分子;检测来自于所述标记的样品分子的信号的计数,以便确定所述基因组或基因组片段特征性的模式或多个模式;将来自于所述标记的样品分子的信号与参比物相关联,以确定所述样品分子对所述基因组或基因组片段的一个或多个区域的覆盖;将所述信号的覆盖深度针对不包含性染色体或其片段的所述基因组或基因组片段的区域所对应的信号的覆盖深度的子集进行缩放,由此提供缩放的覆盖深度;并且通过下述一者、两者或三者对所述缩放的覆盖深度进行归一化:所述多个标记的样品分子的特征性分子长度;或所述参比物的多个区间中每个区间的特征性标记物数目,其中所述参比物包含多个区间;或每个分子的特征性标记物数目或每个分子的预定长度区段内的特征性标记物数目,由此产生所述样品分子的拷贝数曲线,其中在所述拷贝数曲线中由标记物密度引起的偏差和由标记物密度之外的因素引起的偏差被最小化或消除。2.权利要求1的方法,其中对所述缩放的覆盖深度进行归一化包括通过所述多个标记的样品分子的特征性分子长度对所述缩放的覆盖深度进行归一化。3.权利要求1或权利要求2的方法,其还包括产生所述多个样品分子的分子长度的直方图。4.权利要求1-3任一项的方法,其中对所述缩放的覆盖深度进行归一化包括获得由下述公式提供的归一化的标记物覆盖深度:n=Q/[E+GC(1/λ–1/λ0)],其中n表示归一化的标记物覆盖深度,Q表示缩放的标记物覆盖深度,G和E分别表示对于训练集中的多个样品来说,缩放的标记物覆盖深度相对于横坐标的线性回归的梯度和零阶系数,λ表示特征性的样品特异性分子长度,并且λ0表示所述训练集的所述多个样品的特征性分子长度的中值。5.权利要求1-4任一项的方法,其中对所述缩放的覆盖深度进行归一化包括:产生每种标记物的原始覆盖深度曲线;将所述原始覆盖深度曲线变换成相应的缩放的标记物覆盖深度曲线;产生样品特异性特征性分子长度;包含梯度和零阶系数值的参数化;在所述零阶系数的相对误差、基本误差或量级的基础上进行标记物过滤;以及针对所述样品特异性特征性分子长度对缩放的标记物覆盖深度进行归一化。6.权利要求1-5任一项的方法,其中对所述缩放的覆盖深度进行归一化包括进行检测畸变的单分子归一化(SIMONIDA)。7.权利要求1-6任一项的方法,其中对所述缩放的覆盖深度进行归一化包括性染色体归一化。8.权利要求7的方法,其中性染色体归一化包括:在训练样品中的性染色体数目的基础上,对所述训练样品的缩放的标记物覆盖深度进行缩放;以及针对所述多个标记的样品分子的特征性分子长度对缩放的标记物覆盖深度进行归一化,并且还包括将归一化的标记物覆盖深度除以训练集的多个性染色体的归一化的覆盖深度的中值。9.权利要求7或权利要求8的方法,其中将X染色体的归一化的标记物覆盖深度除以训练集的多个女性样品的归一化的覆盖深度的中值。10.权利要求7-9任一项的方法,其中将Y染色体的归一化的标记物覆盖深度除以训练集的多个男性样品的归一化的覆盖深度的中值并进一步除以2。11.权利要求7-10任一项的方法,其中性染色体归一化包括缩放的标记物覆盖深度的稳健的线性回归。12.权利要求7-11任一项的方法,其中性染色体归一化包括只从满足至少一个标记物排除判据的标记物产生拷贝数曲线。13.权利要求12的方法,其中所述拷贝数曲线只从满足下述标准的标记的样品分子的标记物产生:所述标记的样品分子包含给定样品中给定标记物的基本误差与所述标记物的零阶系数的比率,其中所述比率在来自于与所述标记物相同的染色体的多个样品的基本误差的95%分位数内。14.权利要求12的方法,其中Y染色体拷贝数曲线只从满足下述标准的标记的样品分子的标记物产生:相对于训练集的所有男性和所有女性样品的合并的中值绝对偏差,训练集的所有男性样品的所述标记物的归一化的覆盖深度中值显著大于训练集的所有女性样品的归一化的覆盖深度中值。15.权利要求1的方法,其中对所述缩放的覆盖深度进行归一化包括通过所述参比物的多个区间中每个区间的特征性标记物数目对所述缩放的覆盖深度进行归一化。16.权利要求1或15的方法,其中对每个区间的缩放的覆盖深度进行归一化包括获得由下述公式提供的归一化的标记物覆盖深度:n=(c–GL)/E,其中n表示归一化的标记物覆盖深度,c表示缩放的覆盖深度,L表示对于训练集中的多个样品来说,缩放的覆盖深度相对于每个区间的标记物数目的线性回归的梯度,并且G和E分别表示对于训练集中的多个样品来说,缩放的覆盖深度相对于横坐标的线性回归的梯度和零阶系数。17.权利要求1和15-16任一项的方法,其中对所述信号的覆盖深度进行归一化包括进行GROM。18.权利要求1和15-17任一项的方法,其中所述参比物的多个区间包含预定尺寸的区间。19.权利要求1和15-18任一项的方法,其中所述参比物的多个区间尺寸相等。20.权利要求1和15-18任一项的方法,其中所述参比物的多个区间尺寸不等。21.权利要求1和15-18任一项的方法,其中所述多个区间中的每一个包含约10,000至约90,000个碱基对。22.权利要求1和15-18任一项的方法,其中所述多个区间中的每一个包含约40,000至约60,000个碱基对。23.权利要求1和15-18任一项的方法,其中产生拷贝数曲线包括:从检测到的信号产生每个区间的原始覆盖深度曲线;将所述原始覆盖深度曲线变换成相应的每个区间的缩放的覆盖深度曲线;产生样品特异性标记物密度偏差系数(L),其表示对于训练集中的多个样品来说,每个区间的缩放的覆盖深度相对于标记物数目的线性回归的梯度;对区间进行参数化,其中所述区间参数包含梯度和零阶系数值;在至少一个误差测量值的基础上对区间进行过滤;相对于L对缩放的覆盖深度进行归一化,以及从归一化的覆盖深度曲线产生多个拷贝数曲线。24.权利要求1和7-14任一项的方法,其中对所述缩放的覆盖深度进行归一化包括通过每个分子的特征性标记物数目或每个分子的预定长度区段内的特征性标记物数目对所述缩放的覆盖深度进行归一化。25.权利要求24的方法,其中对所述缩放的覆盖深度进行归一化包括通过每个分子的特征性标记物数目对所述缩放的覆盖深度进行归一化。26.权利要求24的方法,其中对所述缩放的覆盖深度进行归一化包括通过每个分子的预定长度区段内的特征性标记物数目对所述缩放的覆盖深度进行归一化。27.权利要求24的方法,其中所述每个分子的预定长度区段包含100kb的核酸。28.权利要求1-27任一项的方法,其中不包含性染色体的所述基因组或基因组片段的区域所对应的信号的覆盖深度的子集包含对应于所述基因组的常染色体区的信号的覆盖深度。29.权利要求1-28任一项的方法,其中所述模式或多个模式包含基因组序列的模式。30.权利要求1-29任一项的方法,其中所述模式或多个模式包含表观遗传模式。31.权利要求1-30任一项的方法,其中对训练集中的多个样品重复所述方法。32.权利要求1-31任一项的方法,其还包括测量误差,包括相对误差。33.权利要求1-32任一项的方法,其还包括将原始覆盖深度曲线储存在计算机可读介质中,其中所述原始覆盖深度曲线包含从所述标记的样品分子检测到的信号覆盖深度。34.权利要求1-33任一项的方法,其中所述参比物包含参比基因组。35.权利要求1-33任一项的方法,其中所述参比物包含hg19或GRCh38。36.权利要求1-33任一项的方法,其中所述参比物包含源自于参比基因组的计算机数字消化的条形码。37.权利要求1-33任一项的方法,其中所述参比物包含标记的参比分子。38.权利要求1-31任一项的方法,其中所述参比物包含光学储存的值或一组值或电子储存的值或一组值。39.权利要求1-38任一项的方法,其中所述第一标记物包含序列特异性标记物。40.权利要求1-37任一项的方法,其中所述第一标记物包含表观遗传标记物。41.权利要求1-39任一项的方法,其中所述第一标记物包含光学标记物。42.权利要求1-39任一项的方法,其中所述第一标记物包含非光学标记物。43.权利要求1-42任一项的方法,其中所述第一标记物包含荧光标记物、放射活性标记物、磁标记物或转录终止子中的至少一者。44.权利要求1-43任一项的方法,其中标记包括将所述样品分子与非切割性限制性酶、锌指蛋白、抗体、转录因子、转录激活因子样结构域、DNA结合蛋白、聚酰胺、形成三螺旋的寡核苷酸和肽核酸以及甲基转移酶中的至少一者相接触。45.权利要求1-44任一项的方法,其中所述拷贝数曲线的升高或下降表示非整倍性。46.权利要求1-45任一项的方法,其还包括自动确定所述基因组或基因组片段的染色体非整倍性的存在或不存在。47.权利要求1-46任一项的方法,其还包括自动确定所述基因组或基因组片段中可能的结构变异的存在或不存在。48.权利要求47的方法,其中自动确定可能的区域性结构变异的存在或不存在包括鉴定所述拷贝数曲线中可能的断点,其中所述拷贝数曲线中与邻近区间相比具有显著不同的拷贝数的区间包含可能的断点。49.权利要求47-48任一项的方法,其中自动确定可能的区域性结构变异的存在或不存在包括确定GROM拷贝数断点。50.权利要求47-48任一项的方法,其中自动确定可能的区域性结构变异的存在或不存在包括确定SIMONIDA拷贝数断点。51.权利要求49-50任一项的方法,其还包括:鉴定GROM拷贝数断点与SIMONIDA拷贝数断点之间的重叠。52.权利要求49-50任一项的方法,其还包括:使用第二种方法确定多个可能的结构变体;以及鉴定所述GROM拷贝数断点或SIMONIDA拷贝数断点与通过第二种方法确定的所述多个可能的结构变体之间的重叠。53.权利要求49-52任一项的方法,其还包括对于每个所述拷贝数断点来说:鉴定参比序列在所述断点的第一侧上的第一区域并遮蔽所述参比序列在所述断点的第二侧上的第二区域,其中所述第二侧与所述第一侧相反;并且对在所述第一区域中与所述参比物对齐的仅仅单分子对齐进行评分。54.权利要求54的方法,其还包括:针对所述第二区域对单分子对齐进行聚簇;以及将每个簇与参比序列进行对齐。55.权利要求1-54任一项的方法,其中所述拷贝数曲线被实时产生。56.权利要求1-54任一项的方法,其中所述拷贝数曲线在所述信号被检测后少于5分钟内产生。57.权利要求1-54任一项的方法,其中所述拷贝数曲线在所述信号被检测后少于60秒内产生。58.权利要求1-57任一项的方法,其中所述拷贝数曲线由与检测来自于所述标记的样品分子和标记的参比分子的信号的检测器数据连通的处理器产生。59.权利要求1-58任一项的方法,其中所述一个或多个基因组片段包含选自下列的常染色体或其至少一个片段:人类1号染色体,人类2号染色体,人类3号染色体,人类4号染色体,人类5号染色体,人类6号染色体,人类7号染色体,人类8号染色体,人类9号染色体,人类10号染色体,人类11号染色体,人类12号染色体,人类13号染色体,人类14号染色体,人类15号染色体,人类16号染色体,人类17号染色体,人类18号染色体,人类19号染色体,人类20号染色体,人类21号染色体,人类22号染色体,人类X染色体,人类Y染色体及其片段。60.权利要求1-59任一项的方法,其中所述样品分子来自于包含可能的基因组异常的样品。61.权利要求59的方法,其中所述遗传异常包括重复、缺失或易位中的至少一者。62.权利要求1-59任一项的方法,其中标记包括用所述标记物标记所述样品分子,并且还包括用不同于所述第一标记物的第二标记物标记所述样品分子。63.权利要求1-62任一项的方法,其中标记包括:使用切口核酸内切酶在第一序列基序处在双链DNA的一条链上产生切口;并且用所述第一标记物标记所述DNA。64.权利要求64的方法,其还包括修复所述DNA上的至少一些所述切口。65.权利要求64任一项的方法,其中所述切口不被修复。66.权利要求1-63任一项的方法,其中标记包括使用选自下列的DNA结合实体为所述样品分子的至少一个序列基序加标签:非切割性限制性酶,锌指蛋白,抗体,转录因子,转录激活因子样结构域,DNA结合蛋白,聚酰胺,形成三螺旋的寡核苷酸和肽核酸以及甲基转移酶。67.权利要求1-66任一项的方法,其中用所述第一标记物标记包括用甲基转移酶为所述样品分子的至少一个序列基序加标签。68.权利要求1-67任一项的方法,其还包括用非序列特异性标记物标记所述样品分子。69.权利要求68的方法,其中所述非序列特异性标记物包含YOYO或POPO染料。70.一种表征样品的方法,所述方法包括:标记样品分子的多核苷酸序列上的多个序列特异性位置;将至少一部分所述样品分子在流体通道中线性化;定量来自于所述样品分子上的所述标记物的信号;将来自于所述标记物的所述信号与参比物相关联;产生所述样品分子的拷贝数曲线;以及当来自于所述样品分子的所述信号的量与从参比分子产生的信号的量不同时,确定所述样品DNA中遗传异常的存在或不存在。71.权利要求70的方法,其中产生拷贝数曲线包括通过所述多个标记的样品分子的特征性分子长度对所述缩放的覆盖深度进行归一化,以最小化或消除偏差。72.权利要求70-71任一项的方法,其还包括产生所述多个样品分子的分子长度的直方图。73.权利要求70-72任一项的方法,其中产生拷贝数曲线包括:产生每种标记物的原始覆盖深度曲线;将所述原始覆盖深度曲线变换成相应的缩放的标记物覆盖深度曲线;产生样品特异性特征性分子长度;包含梯度和零阶系数值的参数化...
【专利技术属性】
技术研发人员:泽利科·扎库拉,
申请(专利权)人:生物纳米基因公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。