用于遗传变异的非侵入性评估的方法和过程技术

技术编号:13134227 阅读:54 留言:0更新日期:2016-04-06 20:44
本文提供用于非侵入性评估遗传变异的方法、操作、系统、装置和设备。

【技术实现步骤摘要】
【国外来华专利技术】相关专利申请本专利申请要求2013年6月21日提交的名为“用于遗传变异的非侵入性评估的方法和过程(METHODSANDPROCESSESFORNON-INVASIVEASSESSMENTOFGENETICVARIATIONS)”,专利技术人为SungK.Kim等,案卷号为SEQ-6071-PV的美国临时专利申请61/838,048的权益。前述专利申请的全部内容通过引用纳入本文,包括其文本、表格和附图。领域本文提供的技术部分涉及用于遗传变异的非侵入性评估的方法、过程和设备。背景活体生物(如动物、植物和微生物)的遗传信息和复制遗传信息的其他形式(如病毒)被编码成脱氧核糖核酸(DNA)或核糖核酸(RNA)。遗传信息是代表化学或假定核酸的一级结构的一连串核苷酸或修饰的核苷酸。人的完整基因组包含位于二十四(24)条染色体上的约30,000个基因(见《人类基因组》(TheHumanGenome),T.Strachan,BIOS科学出版社、1992)。各基因编码特定蛋白质,所述蛋白质在通过转录和翻译表达之后,在活细胞中实现特定的生物化学功能。许多医学病症由一种或多种遗传变异引起。某些遗传变异引起医学病症,包括例如血友病、地中海贫血、杜氏肌营养不良症(DMD)、亨廷顿氏病(HD)、阿尔茨海默病和囊性纤维化(CF)(《人类基因组突变》(HumanGenomeMutations),D.N.Cooper和M.Krawczak,BIOS出版社、1993)。这类遗传疾病可能由特定基因DNA中单个核苷酸的加入、取代或缺失所致。某些出生缺陷由染色体异常(也称为非整倍性)造成,例如21三体性(唐氏综合征)、13三体性(帕陶氏综合征)、18三体性(爱德华氏综合征)、X单体性(特纳氏综合征)和某些性染色体非整倍性如克氏综合征(XXY)。其他遗传变异是胎儿性别,这通常可基于性染色体X和Y来确定。一些遗传变异使个体倾向于或引起许多疾病中的任一种,例如糖尿病、动脉硬化、肥胖症、各种自体免疫疾病和癌症(如结直肠癌、乳腺癌、卵巢癌、肺癌)。对一种或多种遗传变异或变化的鉴定可有助于诊断特定医学病症,或确定特定医学病症的诱因。鉴定遗传变异能帮助医疗决策和/或使用有益的医疗方案。在某些实施方式中,对一种或多种遗传变异或变化的鉴定涉及分析无细胞DNA。无细胞DNA(CF-DNA)由来自细胞死亡和外周血循环的DNA片段组成。高浓度的CF-DNA能指示某些临床病症,例如癌症、创伤、烧伤、心肌梗塞、中风、败血症、感染和其它疾病。此外,无细胞胎儿DNA(CFF-DNA)能在母本血流中检测,并且用于多种非侵入性产前诊断。胎儿核酸存在于母本血浆中使得通过分析母本血样来进行非侵入性产前诊断。例如,母本血浆中胎儿DNA的定量异常能与多种妊娠相关疾病关联,所述疾病包括先兆子痫、未足月产、产前出血、侵入性胎盘形成、胎儿唐氏综合征和其它胎儿染色体非整倍性。因此,分析母本血浆中的胎儿核酸可以是监控母婴健康的有用机制。概述在某些方面,本文提供一种评估来自妊娠女性的测试样品中胎儿核酸的分数的方法,所述方法包括:(a)获得映射至参照基因组的部份的序列读数的计数,其中序列读数是来自妊娠女性的测试样品的循环无细胞核酸的读数、(b)采用微处理器,通过与各部份独立关联的加权因子,将(i)映射至各部份的序列读数的计数,或(ii)其它部份-特异的参数与部份-特异的胎儿核酸分数加权,由此提供基于所述加权因子的部份-特异的胎儿分数估值,其中各加权因子已由以下各部份之间的拟合相关性确定:(i)多个样品中各样品的胎儿核酸分数和(ii)多个样品的映射至各部份的序列读数的计数或其它部份-特异的参数,和(c)基于所述部份-特异的胎儿分数估值,评估测试样品的胎儿核酸的分数。本文还提供一种评估来自妊娠女性的测试样品中胎儿核酸的分数的方法,所述方法包括(a)获得映射至参照基因组的部份的序列读数的计数,其中,序列读数是来自妊娠女性的测试样品的循环无细胞核酸的读数、(b)(i)采用微处理器,根据独立分配至各部份的加权因子,调节映射至各部份的序列读数的计数,由此提供关于所述部份的经调节的计数,或(b)(ii)采用微处理器,选择部份的子集,由此提供计数的子集,其中(b)(i)中的调节或(b)(ii)中的选择基于这样的部份,其中,映射至所述部份的来自胎儿核酸的读数的量增加,和(c)基于经调节的计数或计数的子集评估测试样品的胎儿核酸分数。本文还提供一种提高妊娠女性的测试样品中胎儿核酸的分数的评估的精确性的方法,所述方法包括获得映射至参照基因组的部份的序列读数的计数,所述序列读数是妊娠女性的测试样品的循环无细胞核酸的读数,其中至少所获计数的子集源自所述基因组的区域,所述区域有利于得到比相对基因组其他区域总计数的胎儿核酸计数更大数量的相对该区域总计数的胎儿核酸计数。本文还提供一种系统、装置或设备,其包含一个或多个微处理器和存储器,其中存储器包含可由所述一个或多个微处理器执行的指令,并且其中该可由一个或多个微处理器执行的指令用于(a)访问映射至参照基因组的部份的核苷酸序列读数,其中,序列读数是来自妊娠女性的测试样品的循环无细胞核酸的读数、(b)基于与各部份独立关联的加权因子,将(i)映射至各部份的序列读数的计数,或(ii)其它部份-特异的参数,与部份-特异的胎儿核酸分数加权,由此提供基于该加权因子的部份-特异的胎儿分数估值,其中各加权因子已由如下二者之间的各部份的拟合相关性确定:(i)多个样品中各样品的胎儿核酸的分数,和(ii)多个样品的映射至各部份的序列读数的计数,或其它部份-特异的参数,和(c)基于所述部份-特异的胎儿分数估值,评估测试样品的胎儿核酸的分数。本文还提供一种装置,其包含一个或多个一个或多个微处理器和存储器,其中存储器包含可由所述一个或多个微处理器执行的指令,并且其中存储器包含映射至参照基因组的部份的核苷酸序列读数,其中序列读数是来自妊娠女性的测试样品的循环无细胞核酸的读数,并且其中可由所述一个或多个微处理器执行的指令用于(a)基于与各部份独立关联的加权因子,采用微处理器,将(i)映射至各部份的序列读数的计数,或(ii)其它部份-特异的参数与部份-特异的胎儿核酸分数加权,由此提供基于所述加权因子的部份-特异的胎儿分数估值,其中,各所述加权因子已由如下两者之间的各部份的拟合相关性确定:(i)多个样品各自的胎儿核酸分数,和(ii)多个样品的映射至各部份的序列读数的计数,或其它部份-特异的参数,和(b)基于所述部份-特异的胎儿分数估值评估测试样品的胎儿核酸的分数。本本文档来自技高网...

【技术保护点】
一种评估来自妊娠女性的测试样品中胎儿核酸的分数的方法,所述方法包括:(a)获取映射至参照基因组的部份的序列读数的计数,其中序列读数是妊娠女性的测试样品的循环无细胞核酸的读数;(b)加权,采用微处理器对(i)映射至各部份的序列读数的计数,或(ii)其它部份‑特异的参数,与部份‑特异的胎儿核酸分数加权,所述加权根据与各部份独立相关联的加权因子进行,由此根据所述加权因子提供部份‑特异的胎儿分数估值,其中,所述各加权因子已从各部份的拟合相关性进行确定,所述拟合相关性为(i)多个样品各自的胎儿核酸分数,和(ii)多个样品的映射至各部份的序列读数的计数或其它部份‑特异的参数,之间的拟合相关性;和(c)基于所述部份‑特异的胎儿分数估值评估所述测试样品的胎儿核酸分数。

【技术特征摘要】
【国外来华专利技术】2013.06.21 US 61/838,0481.一种评估来自妊娠女性的测试样品中胎儿核酸的分数的方法,所述方法包括:
(a)获取映射至参照基因组的部份的序列读数的计数,其中序列读数是妊娠女性的测
试样品的循环无细胞核酸的读数;
(b)加权,采用微处理器对(i)映射至各部份的序列读数的计数,或(ii)其它部份-特异
的参数,与部份-特异的胎儿核酸分数加权,所述加权根据与各部份独立相关联的加权因子
进行,由此根据所述加权因子提供部份-特异的胎儿分数估值,
其中,所述各加权因子已从各部份的拟合相关性进行确定,所述拟合相关性为(i)多个
样品各自的胎儿核酸分数,和(ii)多个样品的映射至各部份的序列读数的计数或其它部
份-特异的参数,之间的拟合相关性;和
(c)基于所述部份-特异的胎儿分数估值评估所述测试样品的胎儿核酸分数。
2.如权利要求1所述的方法,其特征在于,所述加权因子与全部常染色体和染色体X和Y
的多个部份中的部份相关联。
3.如权利要求1所述的方法,其特征在于,所述加权因子与多个部份中的部份相关联,
所述多个部份不包括染色体Y中的部份。
4.如权利要求3所述的方法,其特征在于,所述加权因子与多个部份中的部份相关联,
所述多个部份不包括染色体X和Y中的部份。
5.如权利要求2所述的方法,其特征在于,所述加权因子与多个部份中的部份相关联,
所述多个部份包括常染色体中的部份或其子集。
6.如权利要求4或5所述的方法,其特征在于,所述加权因子与多个部份中的部份相关
联,所述多个部份不包括染色体13、18和21中的部份。
7.如权利要求1至6中任一项所述的方法,其特征在于,(b)(i)或(b)(ii)中的计数是标
准化的计数。
8.如权利要求7所述的方法,其特征在于,所述标准化的计数相对于原始计数具有降低
的鸟嘌呤-胞嘧啶(GC)偏差。
9.如权利要求7或8所述的方法,其特征在于,所述标准化的计数是箱式标准化、GC含量
标准化、线性最小二乘方回归、非线性最小二乘方回归、LOESS、GCLOESS、LOWESS、PERUN、重
复遮蔽(RM)、GC-标准化和重复遮蔽(GCRM)、条件分位数标准化(cQn)或其组合的产物。
10.如权利要求1至9中任一项所述的方法,其特征在于,估计所述测试样品的胎儿核酸
分数包括:使所述部份-特异的胎儿分数估值平均化或加和。
11.如权利要求1至10中任一项所述的方法,其特征在于,所述部份-特异的参数是一个
部份-特异的参数或是两个或更多个部份-特异的参数之一。
12.如权利要求1至11中任一项所述的方法,其特征在于,所述部份-特异的参数选自基
因组覆盖率、长度短于选定片段长度的读数的量、可映射性、DNA酶I-灵敏度、甲基化状态、
乙酰化、组蛋白分布和染色质结构。
13.如权利要求1至11中任一项所述的方法,其特征在于,所述部份-特异的参数是鸟嘌
呤-胞嘧啶(GC)含量。
14.如权利要求1至11中任一项所述的方法,其特征在于,所述部份-特异的参数不是鸟
嘌呤-胞嘧啶(GC)含量。
15.如权利要求12所述的方法,其特征在于,所述长度短于选定片段长度的读数的量根
据X与Y的比率确定,其中,X是源自长度短于第一选定片段长度的循环无细胞(CCF)片段的
读数的量,而Y是源自长度短于第二选定片段长度的CCF片段的读数的量。
16.如权利要求15所述的方法,其特征在于,第一选定片段长度是约140-约160个碱基
且第二选定片段长度是约500-约700个碱基。
17.如权利要求16所述的方法,其特征在于,第一选定片段长度是约150个碱基且第二
选定片段长度是约600个碱基。
18.如权利要求15至17中任一项所述的方法,其特征在于,各部份的加权因子与多个样
品的部份的平均比率相关。
19.如权利要求1至17中任一项所述的方法,其特征在于,各部份的加权因子与映射至
多个样品的部份的来自CCF胎儿核酸片段的读数的平均量成比例。
20.如权利要求1至19中任一项所述的方法,其特征在于,所述部份选自离散基因组箱、
具有预定长度的连续序列的基因组箱、可变大小箱、平滑的覆盖率图的基于点的视图及其
组合。
21.如权利要求1至20中任一项所述的方法,其特征在于,所述多个样品来自具有整倍
体胎儿的对象。
22.如权利要求1至20中任一项所述的方法,其特征在于,所述多个样品来自具有三倍
体胎儿的对象。
23.如权利要求1至20中任一项所述的方法,其中,所述多个样品来自具有整倍体胎儿
的对象并来自具有三体性胎儿的对象。
24.如权利要求1至23中任一项所述的方法,其特征在于,所述多个样品来自具有男性
胎儿的对象。
25.如权利要求24所述的方法,其特征在于,所述胎儿核酸的分数根据染色体Y的试验
来确定。
26.如权利要求1至25中任一项所述的方法,其特征在于,调节约1,500部份-约200,000
部份中的计数。
27.如权利要求26所述的方法,其特征在于,各部份是来自参照基因组的约10个连续千
碱基-约75个连续千碱基。
28.如权利要求1至27中任一项所述的方法,其特征在于,加权因子中的约75%或更多
大于零。
29.如权利要求28所述的方法,其特征在于,加权因子中的约85%或更多大于零。
30.如权利要求29所述的方法,其特征在于,加权因子中的约95%或更多大于零。
31.如权利要求1至30中任一项所述的方法,其中,加权因子的分布的宽度取决于来自
CCF胎儿核酸片段的读数的量。
32.如权利要求1至31中任一项所述的方法,其特征在于,加权因子的分布是基本对称
的。
33.如权利要求1至31中任一项所述的方法,其特征在于,加权因子的分布是基本正态
的。
34.如权利要求1至33中任一项所述的方法,其特征在于,所述加权因子是由拟合相关
性估计的系数。
35.如权利要求1至34中任一项所述的方法,其包括由各部份的相关性来估计系数,所
述相关性为(i)多个样品各自的胎儿核酸分数,和(ii)多个样品的映射至各部份的序列读
数的计数或其它部份-特异的参数,之间的相关性。
36.如权利要求34或35所述的方法,其特征在于,所述拟合相关性各自是回归模型,并
且所述加权因子是,或基于,来自所述拟合相关性的回归系数。
37.如权利要求36所述的方法,其特征在于,所述回归模型选自:线性回归模型、简单回
归模型,普通最小二乘回归模型、多重回归模型、一般多重回归模型、多项式回归模型、一般
线性模型、广义线性模型、离散选择回归模型、逻辑回归模型、多项式分对数模型、混合分对
数模型、概率单位模型、多项式概率单位模型、有序分对数模型、有序概率单位模型、泊松模
型、多元响应回归模型、多级模型、固定效应模型、随机效应模型、混合模型、非线性回归模
型、非参数模型、半参数模型、鲁棒模型、分位模型、等渗模型、主成分模型、最小角模型、局
部模型、分段模型和变量误差模型。
38.如权利要求34或35所述的方法,其特征在于,各拟合相关性不是回归模型。
39.如权利要求38所述的方法,其特征在于,各拟合相关性选自决策树模型、支持向量
机模型和神经网络模型。
40.如权利要求1至39中任一项所述的方法,其特征在于,所述拟合相关性通过选自下
组的估计来拟合:最小二乘方、普通最小二乘方、线性、局部、总计、通用的、加权的、非线性、
重复再加权、脊回归、最小绝对偏差、贝叶斯、贝叶斯多变量、降秩、LASSO、弹性净估计量及
其组合。
41.如权利要求1至40中任一项所述的方法,其包括,在(a)之前,通过对来自测试对象
的循环无细胞核酸测序来确定序列读数。
42.如权利要求41所述的方法,其包括,在(a)之前,将序列读数映射至所述参照基因组
的部份。
43.如权利要求41或42所述的方法,其包括,在(a)之前,从所述测试样品分离循环无细
胞核酸。
44.如权利要求43所述的方法,其包括,在(a)之前,从测试对象分离测试样品。
45.如权利要求1至44中任一项所述的方法,其包括,基于估计的胎儿核酸分数,确定测
试样品的胎儿染色体异倍性的存在与否。
46.如权利要求45所述的方法,其特征在于,所述胎儿染色体异倍性是三体性。
47.如权利要求46所述的方法,其特征在于,所述三体性选自染色体21、染色体18,染色
体13或其组合的...

【专利技术属性】
技术研发人员:S·K·金G·汉纳姆J·盖斯C·德兹尤
申请(专利权)人:塞昆纳姆股份有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1