【技术实现步骤摘要】
【国外来华专利技术】相关专利申请本专利申请要求2013年6月21日提交的名为“用于遗传变异的非侵入性评估的方法和过程(METHODSANDPROCESSESFORNON-INVASIVEASSESSMENTOFGENETICVARIATIONS)”,专利技术人为SungK.Kim等,案卷号为SEQ-6071-PV的美国临时专利申请61/838,048的权益。前述专利申请的全部内容通过引用纳入本文,包括其文本、表格和附图。领域本文提供的技术部分涉及用于遗传变异的非侵入性评估的方法、过程和设备。背景活体生物(如动物、植物和微生物)的遗传信息和复制遗传信息的其他形式(如病毒)被编码成脱氧核糖核酸(DNA)或核糖核酸(RNA)。遗传信息是代表化学或假定核酸的一级结构的一连串核苷酸或修饰的核苷酸。人的完整基因组包含位于二十四(24)条染色体上的约30,000个基因(见《人类基因组》(TheHumanGenome),T.Strachan,BIOS科学出版社、1992)。各基因编码特定蛋白质,所述蛋白质在通过转录和翻译表达之后,在活细胞中实现特定的生物化学功能。许多医学病症由一种或多种遗传变异引起。某些遗传变异引起医学病症,包括例如血友病、地中海贫血、杜氏肌营养不良症(DMD)、亨廷顿氏病(HD)、阿尔茨海默病和囊性纤维化(CF)(《人类基因组突变》(HumanGenomeMutations),D.N.Cooper和M.Krawczak,BIOS出版社、1993)。这类遗传疾病可能 ...
【技术保护点】
一种评估来自妊娠女性的测试样品中胎儿核酸的分数的方法,所述方法包括:(a)获取映射至参照基因组的部份的序列读数的计数,其中序列读数是妊娠女性的测试样品的循环无细胞核酸的读数;(b)加权,采用微处理器对(i)映射至各部份的序列读数的计数,或(ii)其它部份‑特异的参数,与部份‑特异的胎儿核酸分数加权,所述加权根据与各部份独立相关联的加权因子进行,由此根据所述加权因子提供部份‑特异的胎儿分数估值,其中,所述各加权因子已从各部份的拟合相关性进行确定,所述拟合相关性为(i)多个样品各自的胎儿核酸分数,和(ii)多个样品的映射至各部份的序列读数的计数或其它部份‑特异的参数,之间的拟合相关性;和(c)基于所述部份‑特异的胎儿分数估值评估所述测试样品的胎儿核酸分数。
【技术特征摘要】
【国外来华专利技术】2013.06.21 US 61/838,0481.一种评估来自妊娠女性的测试样品中胎儿核酸的分数的方法,所述方法包括:
(a)获取映射至参照基因组的部份的序列读数的计数,其中序列读数是妊娠女性的测
试样品的循环无细胞核酸的读数;
(b)加权,采用微处理器对(i)映射至各部份的序列读数的计数,或(ii)其它部份-特异
的参数,与部份-特异的胎儿核酸分数加权,所述加权根据与各部份独立相关联的加权因子
进行,由此根据所述加权因子提供部份-特异的胎儿分数估值,
其中,所述各加权因子已从各部份的拟合相关性进行确定,所述拟合相关性为(i)多个
样品各自的胎儿核酸分数,和(ii)多个样品的映射至各部份的序列读数的计数或其它部
份-特异的参数,之间的拟合相关性;和
(c)基于所述部份-特异的胎儿分数估值评估所述测试样品的胎儿核酸分数。
2.如权利要求1所述的方法,其特征在于,所述加权因子与全部常染色体和染色体X和Y
的多个部份中的部份相关联。
3.如权利要求1所述的方法,其特征在于,所述加权因子与多个部份中的部份相关联,
所述多个部份不包括染色体Y中的部份。
4.如权利要求3所述的方法,其特征在于,所述加权因子与多个部份中的部份相关联,
所述多个部份不包括染色体X和Y中的部份。
5.如权利要求2所述的方法,其特征在于,所述加权因子与多个部份中的部份相关联,
所述多个部份包括常染色体中的部份或其子集。
6.如权利要求4或5所述的方法,其特征在于,所述加权因子与多个部份中的部份相关
联,所述多个部份不包括染色体13、18和21中的部份。
7.如权利要求1至6中任一项所述的方法,其特征在于,(b)(i)或(b)(ii)中的计数是标
准化的计数。
8.如权利要求7所述的方法,其特征在于,所述标准化的计数相对于原始计数具有降低
的鸟嘌呤-胞嘧啶(GC)偏差。
9.如权利要求7或8所述的方法,其特征在于,所述标准化的计数是箱式标准化、GC含量
标准化、线性最小二乘方回归、非线性最小二乘方回归、LOESS、GCLOESS、LOWESS、PERUN、重
复遮蔽(RM)、GC-标准化和重复遮蔽(GCRM)、条件分位数标准化(cQn)或其组合的产物。
10.如权利要求1至9中任一项所述的方法,其特征在于,估计所述测试样品的胎儿核酸
分数包括:使所述部份-特异的胎儿分数估值平均化或加和。
11.如权利要求1至10中任一项所述的方法,其特征在于,所述部份-特异的参数是一个
部份-特异的参数或是两个或更多个部份-特异的参数之一。
12.如权利要求1至11中任一项所述的方法,其特征在于,所述部份-特异的参数选自基
因组覆盖率、长度短于选定片段长度的读数的量、可映射性、DNA酶I-灵敏度、甲基化状态、
乙酰化、组蛋白分布和染色质结构。
13.如权利要求1至11中任一项所述的方法,其特征在于,所述部份-特异的参数是鸟嘌
呤-胞嘧啶(GC)含量。
14.如权利要求1至11中任一项所述的方法,其特征在于,所述部份-特异的参数不是鸟
嘌呤-胞嘧啶(GC)含量。
15.如权利要求12所述的方法,其特征在于,所述长度短于选定片段长度的读数的量根
据X与Y的比率确定,其中,X是源自长度短于第一选定片段长度的循环无细胞(CCF)片段的
读数的量,而Y是源自长度短于第二选定片段长度的CCF片段的读数的量。
16.如权利要求15所述的方法,其特征在于,第一选定片段长度是约140-约160个碱基
且第二选定片段长度是约500-约700个碱基。
17.如权利要求16所述的方法,其特征在于,第一选定片段长度是约150个碱基且第二
选定片段长度是约600个碱基。
18.如权利要求15至17中任一项所述的方法,其特征在于,各部份的加权因子与多个样
品的部份的平均比率相关。
19.如权利要求1至17中任一项所述的方法,其特征在于,各部份的加权因子与映射至
多个样品的部份的来自CCF胎儿核酸片段的读数的平均量成比例。
20.如权利要求1至19中任一项所述的方法,其特征在于,所述部份选自离散基因组箱、
具有预定长度的连续序列的基因组箱、可变大小箱、平滑的覆盖率图的基于点的视图及其
组合。
21.如权利要求1至20中任一项所述的方法,其特征在于,所述多个样品来自具有整倍
体胎儿的对象。
22.如权利要求1至20中任一项所述的方法,其特征在于,所述多个样品来自具有三倍
体胎儿的对象。
23.如权利要求1至20中任一项所述的方法,其中,所述多个样品来自具有整倍体胎儿
的对象并来自具有三体性胎儿的对象。
24.如权利要求1至23中任一项所述的方法,其特征在于,所述多个样品来自具有男性
胎儿的对象。
25.如权利要求24所述的方法,其特征在于,所述胎儿核酸的分数根据染色体Y的试验
来确定。
26.如权利要求1至25中任一项所述的方法,其特征在于,调节约1,500部份-约200,000
部份中的计数。
27.如权利要求26所述的方法,其特征在于,各部份是来自参照基因组的约10个连续千
碱基-约75个连续千碱基。
28.如权利要求1至27中任一项所述的方法,其特征在于,加权因子中的约75%或更多
大于零。
29.如权利要求28所述的方法,其特征在于,加权因子中的约85%或更多大于零。
30.如权利要求29所述的方法,其特征在于,加权因子中的约95%或更多大于零。
31.如权利要求1至30中任一项所述的方法,其中,加权因子的分布的宽度取决于来自
CCF胎儿核酸片段的读数的量。
32.如权利要求1至31中任一项所述的方法,其特征在于,加权因子的分布是基本对称
的。
33.如权利要求1至31中任一项所述的方法,其特征在于,加权因子的分布是基本正态
的。
34.如权利要求1至33中任一项所述的方法,其特征在于,所述加权因子是由拟合相关
性估计的系数。
35.如权利要求1至34中任一项所述的方法,其包括由各部份的相关性来估计系数,所
述相关性为(i)多个样品各自的胎儿核酸分数,和(ii)多个样品的映射至各部份的序列读
数的计数或其它部份-特异的参数,之间的相关性。
36.如权利要求34或35所述的方法,其特征在于,所述拟合相关性各自是回归模型,并
且所述加权因子是,或基于,来自所述拟合相关性的回归系数。
37.如权利要求36所述的方法,其特征在于,所述回归模型选自:线性回归模型、简单回
归模型,普通最小二乘回归模型、多重回归模型、一般多重回归模型、多项式回归模型、一般
线性模型、广义线性模型、离散选择回归模型、逻辑回归模型、多项式分对数模型、混合分对
数模型、概率单位模型、多项式概率单位模型、有序分对数模型、有序概率单位模型、泊松模
型、多元响应回归模型、多级模型、固定效应模型、随机效应模型、混合模型、非线性回归模
型、非参数模型、半参数模型、鲁棒模型、分位模型、等渗模型、主成分模型、最小角模型、局
部模型、分段模型和变量误差模型。
38.如权利要求34或35所述的方法,其特征在于,各拟合相关性不是回归模型。
39.如权利要求38所述的方法,其特征在于,各拟合相关性选自决策树模型、支持向量
机模型和神经网络模型。
40.如权利要求1至39中任一项所述的方法,其特征在于,所述拟合相关性通过选自下
组的估计来拟合:最小二乘方、普通最小二乘方、线性、局部、总计、通用的、加权的、非线性、
重复再加权、脊回归、最小绝对偏差、贝叶斯、贝叶斯多变量、降秩、LASSO、弹性净估计量及
其组合。
41.如权利要求1至40中任一项所述的方法,其包括,在(a)之前,通过对来自测试对象
的循环无细胞核酸测序来确定序列读数。
42.如权利要求41所述的方法,其包括,在(a)之前,将序列读数映射至所述参照基因组
的部份。
43.如权利要求41或42所述的方法,其包括,在(a)之前,从所述测试样品分离循环无细
胞核酸。
44.如权利要求43所述的方法,其包括,在(a)之前,从测试对象分离测试样品。
45.如权利要求1至44中任一项所述的方法,其包括,基于估计的胎儿核酸分数,确定测
试样品的胎儿染色体异倍性的存在与否。
46.如权利要求45所述的方法,其特征在于,所述胎儿染色体异倍性是三体性。
47.如权利要求46所述的方法,其特征在于,所述三体性选自染色体21、染色体18,染色
体13或其组合的...
【专利技术属性】
技术研发人员:S·K·金,G·汉纳姆,J·盖斯,C·德兹尤,
申请(专利权)人:塞昆纳姆股份有限公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。