【技术实现步骤摘要】
检测染色体非整倍性的方法、装置及系统
本专利技术涉及生物信息学领域,具体地,涉及一种检测染色体非整倍性的方法、装置及系统。
技术介绍
唐氏综合征(21-三体)、爱德华茨综合征(13-三体)、帕陶氏综合征(18-三体)是最常见的新生儿染色体非整倍体疾病,它们的发病率分别1/700[Papageorgiou,E.A.etal.Fetal-specificDNAmethylationratiopermitsnoninvasiveprenataldiagnosisoftrisomy21.Nat.Med.17,510–513(2011).],1/6,000和1/10,000[Driscoll,D.A.&Gross,S.PrenatalScreeningforAneuploidy.N.Engl.J.Med.360,2556–2562(2009).]。这些染色体非整倍体会导致很高的发病率与死亡率,羊膜穿刺和绒毛膜取样是诊断胎儿染色体异常的标准方法,可是这些诊断方法的本身会带来高达0.6%到1.9%的流产率。为了避免这些风险,需要开发更加安全,检测孕周更加提前的非入侵的胎儿非整倍体异常(NIPT)的检测方法。1997年卢煜明[Lo,Y.M.D.etal.PresenceoffetalDNAinmaternalplasmaandserum.Lancet350,485–487(1997).]首次报道了在孕妇体内检测出胎儿的游离DNA(cffDNA),这使得通过母体的血液来检查胎儿的基因状况成为可能。据报道,第一孕期和第二孕期cffDNA在母体游离DNA的占比约4-10 ...
【技术保护点】
1.一种检测染色体非整倍性的方法,其特征在于,包括:(1)对待测样本中的至少一部分核酸进行测序,获得包括读段的测序结果;(2)将所述读段比对到第一参考序列,获得比对结果,所述比对结果包括所述读段定位于具体染色体的信息,所述第一参考序列为参考基因组上的比对能力为1的区域的集合,比对能力为1的区域为定位到所述参考基因组上唯一位置的区域;(3)对于第一染色体,基于所述比对结果,确定定位到该第一染色体的读段的量;(4)比较所述定位到该第一染色体的读段的量与阴性样本中的定位到相应第一染色体的读段的量,以判定该第一染色体的数目。
【技术特征摘要】
1.一种检测染色体非整倍性的方法,其特征在于,包括:(1)对待测样本中的至少一部分核酸进行测序,获得包括读段的测序结果;(2)将所述读段比对到第一参考序列,获得比对结果,所述比对结果包括所述读段定位于具体染色体的信息,所述第一参考序列为参考基因组上的比对能力为1的区域的集合,比对能力为1的区域为定位到所述参考基因组上唯一位置的区域;(3)对于第一染色体,基于所述比对结果,确定定位到该第一染色体的读段的量;(4)比较所述定位到该第一染色体的读段的量与阴性样本中的定位到相应第一染色体的读段的量,以判定该第一染色体的数目。2.如权利要求1所述的方法,其特征在于,所述区域的比对能力的确定包括:以大小为L1的第一窗口对所述参考基因组进行滑窗,获得多个所述区域,任选的,所述滑窗的步长为1bp;将所述区域比对到所述参考基因组,基于所述区域比对到所述参考基因组的位置的数目计算该区域的比对能力;任选的,所述阴性样本的数目不小于20个,任选的不小于30个;任选的,以如下方式确定阴性样本中定位到相应第一染色体的读段的量:以阴性样本替代待测样本进行(1)-(3),以确定定位到该阴性样本的第一染色体的读段的量;以多个阴性样本的第一染色体的读段的量的均值作为阴性样本中定位到相应第一染色体的读段的量;任选的,所述第一参考序列为去除了下表所示区域的人参考基因组hg19序列中的至少一部分:任选的,所述第一参考序列为去除了符合以下条件的第二窗口对应的区域的参考基因组的至少一部分:该第二窗口的测序深度不小于所有第二窗口的测序深度的平均值的4倍,任选的,该第二窗口的测序深度不小于所有第二窗口的测序深度的平均值的6倍;所述第二窗口通过利用大小为L2的窗口对所述参考基因组进行滑窗获得,任选的,所述滑窗的步长为L2,所述第二窗口的测序深度为比对上该第二窗口的读段的数目与该第二窗口大小的比值;任选的,所述第一参考序列为对参考基因组上第二窗口对应的区域进行以下处理的参考基因组的至少一部分进行以下处理:对百分位数大于98的第二窗口的测序深度赋值为百分位数等于98的第二窗口的测序深度,任选的,对百分位数大于99的第二窗口的测序深度赋值为百分位数等于99的第二窗口的测序深度;所述第二窗口通过利用大小为L2的窗口对所述参考基因组进行滑窗获得,任选的,所述滑窗的步长为L2,所述第二窗口的测序深度为比对上该第二窗口的读段的数目与该第二窗口大小L2的比值;任选的,所述方法包括,在进行步骤(3)之前,进行如下(i)-(iii)中至少一项:(i)去除所述测序结果中的长度不大于预定长度的读段;(ii)去除所述比对结果中非定位到第一参考序列唯一位置的读段;(iii)去除所述比对结果中错误率不小于预定错误率的读段,读段的错误率为比对后该读段上为插入、缺失和错配的碱基中的至少一种所占的比例。3.如权利要求1或2所述的方法,其特征在于,步骤(3)包括,(a)以大小为L3的窗口对所述第一参考序列进行滑窗,获得多个第三窗口;(b)基于所述比对结果,确定所述第三窗口的测序深度,所述第三窗口的测序深度为比对上该第三窗口的读段的数目与该第三窗口大小L3的比值;(c)基于所述第一染色体所包含的第三窗口的测序深度,确定所述定位到该第一染色体的读段的量;任选的,(b)还包括,对所述第三窗口的测序深度进行标准化处理,以标准化后的第三窗口的测序深度作为所述第三窗口的测序深度;任选的,(b)还包括,基于所述第三窗口的GC含量对所述第三窗口的测序深度进行校正,以校正后的第三窗口的测序深度作为所述第三窗口的测序深度;任选的,利用所述第三窗口的GC含量与所述第三窗口的测序深度的关系进行所述校正;任选的,利用局部加权回归法建立所述第三窗口的GC含量与第三窗口的测序深度的关系;任选的,(c)包括,基于所述第三窗口的测序深度确定比对到该第三窗口的读段的权重系数,基于所述权重系数确定所述定位到该第一染色体的读段的量。4.如权利要求1-3任一项所述的方法,其特征在于,所述待测样本为孕妇血液样本;任选的,所述第一染色体为胎儿13、18和21号染色体中的至少一个。5.一种检测染色体非整倍性的装置,其特征在于,包括:测序模块,用于对待测样本中的至少一部分核酸进行测序,获得包括读段的测序结果;比对模块,用于将来自测序模块的读段比...
【专利技术属性】
技术研发人员:曾立董,吴增丁,金欢,徐伟彬,李林森,赵陆洋,张萌,颜钦,
申请(专利权)人:深圳市瀚海基因生物科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。