检测染色体非整倍性的方法、装置及系统制造方法及图纸

技术编号:19122403 阅读:27 留言:0更新日期:2018-10-10 05:21
本发明专利技术公开了一种检测染色体非整倍性的方法、装置及系统。方法包括:对待测样本中的至少一部分核酸进行测序,获得包括读段的测序结果;将读段比对到第一参考序列,获得比对结果,比对结果包括读段定位于具体染色体的信息;对于第一染色体,基于比对结果,确定定位到该第一染色体的读段的量;比较定位到该第一染色体的读段的量与阴性样本中的定位到相应第一染色体的读段的量,以判定该第一染色体的数目。利用该方法进行染色体非整倍性检测,获得的检测结果具有较高灵敏度和准确性。

【技术实现步骤摘要】
检测染色体非整倍性的方法、装置及系统
本专利技术涉及生物信息学领域,具体地,涉及一种检测染色体非整倍性的方法、装置及系统。
技术介绍
唐氏综合征(21-三体)、爱德华茨综合征(13-三体)、帕陶氏综合征(18-三体)是最常见的新生儿染色体非整倍体疾病,它们的发病率分别1/700[Papageorgiou,E.A.etal.Fetal-specificDNAmethylationratiopermitsnoninvasiveprenataldiagnosisoftrisomy21.Nat.Med.17,510–513(2011).],1/6,000和1/10,000[Driscoll,D.A.&Gross,S.PrenatalScreeningforAneuploidy.N.Engl.J.Med.360,2556–2562(2009).]。这些染色体非整倍体会导致很高的发病率与死亡率,羊膜穿刺和绒毛膜取样是诊断胎儿染色体异常的标准方法,可是这些诊断方法的本身会带来高达0.6%到1.9%的流产率。为了避免这些风险,需要开发更加安全,检测孕周更加提前的非入侵的胎儿非整倍体异常(NIPT)的检测方法。1997年卢煜明[Lo,Y.M.D.etal.PresenceoffetalDNAinmaternalplasmaandserum.Lancet350,485–487(1997).]首次报道了在孕妇体内检测出胎儿的游离DNA(cffDNA),这使得通过母体的血液来检查胎儿的基因状况成为可能。据报道,第一孕期和第二孕期cffDNA在母体游离DNA的占比约4-10%,在第三孕期达到10-20%。2008年卢煜明[Chiu,R.W.K.etal.NoninvasiveprenataldiagnosisoffetalchromosomalaneuploidybymassivelyparallelgenomicsequencingofDNAinmaternalplasma.Proc.Natl.Acad.Sci.105,20458–20463(2008).]和SetphenQuake[Chitkara,U.etal.NoninvasivediagnosisoffetalaneuploidybyshotgunsequencingDNAfrommaternalblood.Proc.Natl.Acad.Sci.U.S.A.105,16266–71(2008).]分别报道应用下一代测序(NGS)技术检测出胎儿染色体非整倍体异常。目前可应用于基因检测的测序平台越来越多。基于各平台的下机数据进行染色体非整倍性变异检测,检测的灵敏度和/或准确性一直有待进一步提高,多因素关系检测灵敏度和/或准确性,例如不同测序平台产生的下机数据的长度差异较大,下机数据也称为读段(reads),读段的长度也称为读长,从几十bp到数千bp不等,读长至少影响下机数据匹配(定位)的置信度高低;又例如,测序错误率高低也影响读段定位的置信度,一般地,错误率越高,置信度越低。
技术实现思路
本专利技术实施方式旨在至少解决相关技术中存在的技术问题之一或者至少提供一种可选择的实用方案。依据本专利技术的一个实施方式,提供一种检测染色体非整倍性变异的方法,包括:(1)对待测样本中的至少一部分核酸进行测序,获得包括读段的测序结果;(2)将读段比对到第一参考序列,获得比对结果,比对结果包括读段定位于具体染色体的信息,第一参考序列为参考基因组上的比对能力为1的区域的集合,比对能力为1的区域是指定位到参考基因组上唯一位置的区域;(3)对于第一染色体,基于比对结果,确定定位到该第一染色体的读段的量;(4)比较定位到该第一染色体的读段的量与阴性样本中的定位到相应第一染色体的读段的量,以判定该第一染色体的数目。该方法包括利用特定的参考序列对读段进行筛选以及定位,能够快速简单地实现染色体非整倍性检测,获得准确的检测结果。适用于基于各种测序平台的下机数据的检测分析,特别适用于对包含未能识别的碱基的读段的检测分析,即包含空缺(gap)的读段的处理分析。依据本专利技术的另一实施方式,提供一种检测染色体非整倍性变异的装置,该装置用以实施上述本专利技术实施方式中的检测染色体非整倍性的方法,该装置包括:测序模块:该测序模块用于对待测样本中的至少一部分核酸进行测序,获得包括读段的测序结果;比对模块:该比对模块用于将来自测序模块的读段比对到第一参考序列,获得比对结果,比对结果包括读段定位于染色体的信息,第一参考序列为参考基因组上的比对能力为1的区域的集合,比对能力为1的区域是指定位到参考基因组上唯一位置的区域;定量模块:对于第一染色体,该定量模块用于基于来自比对模块的比对结果,确定定位到该第一染色体的读段的量;判断模块:该判断模块用于比较来自定量模块的定位到该第一染色体的读段的量与阴性样本中的定位到相应第一染色体的读段的量,以判定该第一染色体的数目。依据本专利技术的另一实施方式,还提供一种计算机可读介质,用于存储/承载计算机可执行程序,在执行该程序时,通过指令相关硬件可完成上述本专利技术实施方式中的检测染色体非整倍性的方法的全部或部分步骤。所称介质包括但不限于:只读存储器、随机存储器、磁盘或光盘等。依据本专利技术的又一实施方式,提供一种终端,一种检测染色体非整倍性变异的系统,该系统包含计算机可执行程序,该系统包括处理器,该处理器能够用于执行上述计算机可执行程序,执行计算机可执行程序包括完成上述本专利技术实施方式中的检测染色体非整倍性的方法。上述任一实施方式提供的检测染色体非整倍性的方法、装置和/或系统可以用于染色体非整倍性变异检测,获得的检测结果具有较高灵敏度和准确性。适用于基于各种测序平台的下机数据的检测分析,特别适用于对包含未能识别的碱基的读段的检测分析,即包含空缺(gap)的读段的处理分析。本专利技术实施方式的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术实施方式的实践了解到。附图说明图1是本专利技术具体实施方式利用的比对方式中的参考库的相邻两个条目的距离的示意图。图2是本专利技术具体实施方式利用的比对方式的连通长度示意图。图3是本专利技术的具体实施方式中的变异系数与窗口大小的关系示意图。图4是本专利技术具体实施方式中的染色体标准化的测序深度和染色体的GC含量的关系示意图。具体实施方式下面详细描述本专利技术的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。在本专利技术的描述中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者顺序。在本专利技术的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。本专利技术实施方式所称的测序,也称为序列测定,指核酸序列测定,包括DNA测序和/或RNA测序,包括长片段测序和/或短片段测序。测序可以通过测序平台进行,测序平台可选择但不限于Illumina公司的Hisq/Miseq/Nextseq测序平台、ThermoFisher/LifeTechnologies公司的本文档来自技高网
...
检测染色体非整倍性的方法、装置及系统

【技术保护点】
1.一种检测染色体非整倍性的方法,其特征在于,包括:(1)对待测样本中的至少一部分核酸进行测序,获得包括读段的测序结果;(2)将所述读段比对到第一参考序列,获得比对结果,所述比对结果包括所述读段定位于具体染色体的信息,所述第一参考序列为参考基因组上的比对能力为1的区域的集合,比对能力为1的区域为定位到所述参考基因组上唯一位置的区域;(3)对于第一染色体,基于所述比对结果,确定定位到该第一染色体的读段的量;(4)比较所述定位到该第一染色体的读段的量与阴性样本中的定位到相应第一染色体的读段的量,以判定该第一染色体的数目。

【技术特征摘要】
1.一种检测染色体非整倍性的方法,其特征在于,包括:(1)对待测样本中的至少一部分核酸进行测序,获得包括读段的测序结果;(2)将所述读段比对到第一参考序列,获得比对结果,所述比对结果包括所述读段定位于具体染色体的信息,所述第一参考序列为参考基因组上的比对能力为1的区域的集合,比对能力为1的区域为定位到所述参考基因组上唯一位置的区域;(3)对于第一染色体,基于所述比对结果,确定定位到该第一染色体的读段的量;(4)比较所述定位到该第一染色体的读段的量与阴性样本中的定位到相应第一染色体的读段的量,以判定该第一染色体的数目。2.如权利要求1所述的方法,其特征在于,所述区域的比对能力的确定包括:以大小为L1的第一窗口对所述参考基因组进行滑窗,获得多个所述区域,任选的,所述滑窗的步长为1bp;将所述区域比对到所述参考基因组,基于所述区域比对到所述参考基因组的位置的数目计算该区域的比对能力;任选的,所述阴性样本的数目不小于20个,任选的不小于30个;任选的,以如下方式确定阴性样本中定位到相应第一染色体的读段的量:以阴性样本替代待测样本进行(1)-(3),以确定定位到该阴性样本的第一染色体的读段的量;以多个阴性样本的第一染色体的读段的量的均值作为阴性样本中定位到相应第一染色体的读段的量;任选的,所述第一参考序列为去除了下表所示区域的人参考基因组hg19序列中的至少一部分:任选的,所述第一参考序列为去除了符合以下条件的第二窗口对应的区域的参考基因组的至少一部分:该第二窗口的测序深度不小于所有第二窗口的测序深度的平均值的4倍,任选的,该第二窗口的测序深度不小于所有第二窗口的测序深度的平均值的6倍;所述第二窗口通过利用大小为L2的窗口对所述参考基因组进行滑窗获得,任选的,所述滑窗的步长为L2,所述第二窗口的测序深度为比对上该第二窗口的读段的数目与该第二窗口大小的比值;任选的,所述第一参考序列为对参考基因组上第二窗口对应的区域进行以下处理的参考基因组的至少一部分进行以下处理:对百分位数大于98的第二窗口的测序深度赋值为百分位数等于98的第二窗口的测序深度,任选的,对百分位数大于99的第二窗口的测序深度赋值为百分位数等于99的第二窗口的测序深度;所述第二窗口通过利用大小为L2的窗口对所述参考基因组进行滑窗获得,任选的,所述滑窗的步长为L2,所述第二窗口的测序深度为比对上该第二窗口的读段的数目与该第二窗口大小L2的比值;任选的,所述方法包括,在进行步骤(3)之前,进行如下(i)-(iii)中至少一项:(i)去除所述测序结果中的长度不大于预定长度的读段;(ii)去除所述比对结果中非定位到第一参考序列唯一位置的读段;(iii)去除所述比对结果中错误率不小于预定错误率的读段,读段的错误率为比对后该读段上为插入、缺失和错配的碱基中的至少一种所占的比例。3.如权利要求1或2所述的方法,其特征在于,步骤(3)包括,(a)以大小为L3的窗口对所述第一参考序列进行滑窗,获得多个第三窗口;(b)基于所述比对结果,确定所述第三窗口的测序深度,所述第三窗口的测序深度为比对上该第三窗口的读段的数目与该第三窗口大小L3的比值;(c)基于所述第一染色体所包含的第三窗口的测序深度,确定所述定位到该第一染色体的读段的量;任选的,(b)还包括,对所述第三窗口的测序深度进行标准化处理,以标准化后的第三窗口的测序深度作为所述第三窗口的测序深度;任选的,(b)还包括,基于所述第三窗口的GC含量对所述第三窗口的测序深度进行校正,以校正后的第三窗口的测序深度作为所述第三窗口的测序深度;任选的,利用所述第三窗口的GC含量与所述第三窗口的测序深度的关系进行所述校正;任选的,利用局部加权回归法建立所述第三窗口的GC含量与第三窗口的测序深度的关系;任选的,(c)包括,基于所述第三窗口的测序深度确定比对到该第三窗口的读段的权重系数,基于所述权重系数确定所述定位到该第一染色体的读段的量。4.如权利要求1-3任一项所述的方法,其特征在于,所述待测样本为孕妇血液样本;任选的,所述第一染色体为胎儿13、18和21号染色体中的至少一个。5.一种检测染色体非整倍性的装置,其特征在于,包括:测序模块,用于对待测样本中的至少一部分核酸进行测序,获得包括读段的测序结果;比对模块,用于将来自测序模块的读段比...

【专利技术属性】
技术研发人员:曾立董吴增丁金欢徐伟彬李林森赵陆洋张萌颜钦
申请(专利权)人:深圳市瀚海基因生物科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1