确定个体染色体结构异常的方法和系统技术方案

技术编号:20235520 阅读:92 留言:0更新日期:2019-01-29 20:59
本发明专利技术提出了一种确定个体染色体结构异常的方法。该方法包括:(1)利用核型分析和微阵列芯片分析的至少之一,确定所述个体的第一候选染色体结构异常类型,以便获得第一候选染色体异常类型集合;(2)对所述个体的组织样本进行全基因组测序,并对所得到的测序结果进行第一数据分析,以便获得第二候选染色体异常类型集合;(3)对所述个体的单细胞样本进行全基因组测序,并对所得到的测序结果进行第二数据分析,以便获得第三候选染色体异常类型集合;(4)基于所述第一候选染色体异常类型集合、第二候选染色体异常类型集合和第三候选染色体异常类型集合,确定所述个体的最终染色体结构异常类型。

Methods and Systems for Determining Individual Chromosome Structural Abnormalities

The invention provides a method for determining the structural abnormalities of individual chromosomes. The method includes: (1) using karyotype analysis and at least one of microarray chip analysis to determine the first candidate chromosome structural abnormality type of the individual, so as to obtain the first candidate chromosome abnormality type set; (2) genome-wide sequencing of the tissue samples of the individual, and the first data analysis of the sequencing results, so as to obtain the second candidate chromosome. Abnormal type sets; (3) Genome-wide sequencing of the individual's single cell samples, and second data analysis of the sequencing results, in order to obtain the third candidate chromosome abnormal type set; (4) Based on the first candidate chromosome abnormal type set, the second candidate chromosome abnormal type set and the third candidate chromosome abnormal type set, the above mentioned method is determined. The final type of chromosomal structural abnormality of an individual.

【技术实现步骤摘要】
确定个体染色体结构异常的方法和系统
本专利技术涉及生物检测领域,具体地,本专利技术涉及确定个体染色体结构异常的方法和系统。
技术介绍
染色体变异在影响人类健康中发挥着至关重要的作用,尤其与智力发育、癌症、不孕不育等疾病的发生有密切关联。自1971年巴黎国际染色体命名会议以来,已发现人类染色体数目异常和结构畸变3000余种,目前已确认染色体病综合征100余种,智力低下和生长发育迟滞是染色体病的共同特征。Down综合征(Down’ssyndrome)是人类最常见的染色体疾病,其他已知的染色体综合症疾病包括DiGeorge综合症、Patau综合征、Williams综合征、Prader-Willi和Angelman综合征等。而染色体其他类型的结构畸变如易位(translocation)、倒位(inversion)甚至是染色体的碎裂(chromothripis)也是致病致死的重要原因之一。2012年Talkowski团队报道了一例胎儿患有CHARGE综合症而死胎,其原因为6号和8号染色体的自发性平衡易位导致基因CHD7基因融合而功能失活。对植入前胚胎、孕妇进行相应的检测手段可以及时发现进而采取相应的干预措施,可以显著降低新生儿的出生缺陷率,提高人口的优生率。另一方面,染色体的畸变以及因畸变而形成的融合基因也是癌症的发生发展重要机制之一。1960年第一个融合基因就被Nowell和Hungerford等在白血病慢性髓细胞性白血病的白细胞中发现。而至今已有多种融合基因被认定为肿瘤的致病突变,如前列腺癌中的TMRPSS2-ERG在高加索人中达到50%。因此,通过早期无创的检测手段鉴定此类畸变将为肿瘤的早期诊断和干预带来历史性突破。另一方面,针对植入前筛查诊断和孕妇产前筛查诊断、疑似癌症患者的无创染色体畸变检测需求,目前尚无有效的检测方法。目前,单细胞的提取后进行检测分析特别是进行高通量测序已经较为广泛的应用于肿瘤研究和早期胚胎的植入前诊断与筛查。PeasonHA在1967年发现孕妇血液中存在胎儿有核红细胞(FetalNucleatedRedBloodCell,NRBC),而ThomasAshworth更早在1869年患有转移癌症的患者血液里面发现了循环肿瘤细胞(CirculatingTumorcells,CTCs)等,这无创方式检测染色体结构畸变提供了可能。另外,部分早期胚胎存在的导致植入成功率降低的畸变以及只存在于少数细胞(如早期癌细胞)中的突变也可以通过单细胞检测技术得到还原。基于基因组DNA采用高通量测序进行易位重组检测早在2011年Talkowski团队完成有效查找,但并未有效解决由于建库测序以及后期比对分析带来的系统性误差带来的高假阳性。因此,对于染色体结构异常的检测方法仍有待进一步开发和改进。
技术实现思路
本申请是专利技术人基于对以下问题和事实的发现而提出的:现有技术中核型分析作为检测染色体畸变的金标准目前在临床诊断上广泛应用,但因其精度较低(仅能检测5Mb以上的异常),而无法准确诊断微小染色体结构变异。微阵列芯片(arrayComparativeGenomicHybridization,aCGH)目前已经由美国国家食物药品监管局推荐在有创产前诊断中推广应用,但其仅能够检测出剂量(dosage)增加或减少的畸变类型。并且目前已开发出的高通量测序检测技术,针对单细胞染色体变异检测,也仅能检测微缺失微重复,针对倒位、平衡易位目前还没有有效的高通量检测方法。本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。本申请的专利技术团队突破传统检测方法的局限性,针对单细胞样品开发了一套检测染色体结构变异的技术,该技术在染色体疾病筛查、癌症分型及用药指导等问题的解决上发挥重要作用。并且专利技术人基于高通量测序技术的精度优势,开发了基于全基因组低深度测序,利用大人群数据建立参照集筛除系统性错误导致的假阳性,能够检测大部分致病性染色体结构变异的方法,较大提高了新生儿缺陷的检出率。在本专利技术的第一方面,本专利技术提出了一种确定个体染色体结构异常的方法。根据本专利技术的实施例,所述方法包括:(1)利用核型分析和微阵列芯片分析的至少之一,确定所述个体的第一候选染色体结构异常类型,以便获得第一候选染色体异常类型集合,所述第一候选染色体异常类型集合作为金标准结果集合;(2)对所述个体的组织样本进行全基因组测序,并对所得到的测序结果进行第一数据分析,以便获得第二候选染色体异常类型集合,优选地,所述组织样本为血液样本;(3)对所述个体的单细胞样本进行全基因组测序,并对所得到的测序结果进行第二数据分析,以便获得第三候选染色体异常类型集合,优选地,所述细胞样本为淋巴细胞样本;(4)基于所述第一候选染色体异常类型集合、第二候选染色体异常类型集合和第三候选染色体异常类型集合,确定所述个体的最终染色体结构异常类型。利用根据本专利技术实施例的确定个体染色体结构异常的方法有效实现了微小染色体结构变异的检测,并且有效实现了针对单细胞染色体变异的高效检测。在本专利技术的第二方面,本专利技术提出了一种确定个体染色体结构异常的系统。根据本专利技术的实施例,所述系统包括:金标准检测单元,所述金标准检测单元用于利用核型分析和微阵列芯片分析的至少之一,确定所述个体的第一候选染色体结构异常类型,以便获得第一候选染色体异常类型集合,所述第一候选染色体异常类型集合作为金标准结果集合;组织样本全基因组测序单元,所述基因组测序单元用于对所述个体的组织样本进行全基因组测序,并对所得到的测序结果进行第一数据分析,以便获得第二候选染色体异常类型集合,优选地,所述组织样本为血液样本;单细胞样本全基因组测序单元,所述单细胞样本全基因组测序单元用于对所述个体的单细胞样本进行全基因组测序,并对所得到的测序结果进行第二数据分析,以便获得第三候选染色体异常类型集合,优选地,所述细胞样本为淋巴细胞样本;染色体结构异常分析单元,所述染色体结构异常分析单元用于基于所述第一候选染色体异常类型集合、第二候选染色体异常类型集合和第三候选染色体异常类型集合,确定所述个体的最终染色体结构异常类型。利用根据本专利技术实施例的确定个体染色体结构异常的系统有效实现了微小染色体结构变异的检测,并且有效实现了针对单细胞染色体变异的高效检测。附图说明图1是根据本专利技术实施例的样品收集流程图;图2是根据本专利技术实施例的建库测序流程图;图3是根据本专利技术实施例的确定个体染色体结构异常的系统的结构示意图;图4是根据本专利技术实施例的染色体结构异常分析单元的结构示意图;图5是根据本专利技术实施例的染色体结构异常分析单元的结构示意图;图6是根据本专利技术实施例的染色体结构异常分析单元的结构示意图;图7是根据本专利技术实施例的染色体结构异常分析单元的结构示意图;以及图8是根据本专利技术实施例的染色体结构异常分析单元的结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。确定个体染色体结构异常的方法在本专利技术的第一方面,本专利技术提出了一种确定个体染色体结构异常的方法。根据本专利技术的实施例,所述方法包括:(1)利用核型分析和微阵列芯片分析的至少之一,确定所述个体的第一候选染色体结构异常类型本文档来自技高网
...

【技术保护点】
1.一种确定个体染色体结构异常的方法,其特征在于,包括:(1)利用核型分析和微阵列芯片分析的至少之一,确定所述个体的第一候选染色体结构异常类型,以便获得第一候选染色体异常类型集合,所述第一候选染色体异常类型集合作为金标准结果集合;(2)对所述个体的组织样本进行全基因组测序,并对所得到的测序结果进行第一数据分析,以便获得第二候选染色体异常类型集合,优选地,所述组织样本为血液样本;(3)对所述个体的单细胞样本进行全基因组测序,并对所得到的测序结果进行第二数据分析,以便获得第三候选染色体异常类型集合,优选地,所述细胞样本为淋巴细胞样本;(4)基于所述第一候选染色体异常类型集合、第二候选染色体异常类型集合和第三候选染色体异常类型集合,确定所述个体的最终染色体结构异常类型。

【技术特征摘要】
1.一种确定个体染色体结构异常的方法,其特征在于,包括:(1)利用核型分析和微阵列芯片分析的至少之一,确定所述个体的第一候选染色体结构异常类型,以便获得第一候选染色体异常类型集合,所述第一候选染色体异常类型集合作为金标准结果集合;(2)对所述个体的组织样本进行全基因组测序,并对所得到的测序结果进行第一数据分析,以便获得第二候选染色体异常类型集合,优选地,所述组织样本为血液样本;(3)对所述个体的单细胞样本进行全基因组测序,并对所得到的测序结果进行第二数据分析,以便获得第三候选染色体异常类型集合,优选地,所述细胞样本为淋巴细胞样本;(4)基于所述第一候选染色体异常类型集合、第二候选染色体异常类型集合和第三候选染色体异常类型集合,确定所述个体的最终染色体结构异常类型。2.根据权利要求1所述的方法,其特征在于,所述染色体结构异常包括结构变异SV和拷贝数变异CNV的至少之一。3.根据权利要求1所述的方法,其特征在于,所述第一数据分析和所述第二数据分析的至少之一是通过下列步骤进行的:(a)将所述测序结果与基因组参考序列比对,所述测序结果由多对读长对构成;(b)基于步骤(a)的比对结果,确定所述多对读长对的每一对在所述基因组参考序列上的物理距离;(c)基于步骤(b)中获得的所述物理距离,将所述多对读长对区分为正常匹配集合和异常匹配集合;(d)将所述异常匹配集合中的读长进行聚类,以便获得多对读长簇对;(e)基于各读长簇对中所含有读长的紧致程度和线性相关性,对所述多对读长簇对进行过滤;以及(f)基于所述的经过过滤的多对读长簇对,确定染色体结构异常的断点和染色体异常类型。4.根据权利要求3所述的方法,其特征在于,在步骤(c)中,通过将所述物理距离与预定的核酸片段长度相比较,将所述多对读长对区分为正常匹配集合和异常匹配集合,其中,所述预定的核酸长度是基于所述全基因组测序的插入片段大小而确定的。5.根据权利要求3所述的方法,其特征在于,所述紧致程度是基于下列公式确定的:其中,x1,x2,x3…xn表示读长簇的reads的位置,n表示读长条数,M表示位置的平均值,s2表示方差。6.根据权利要求5所述的方法,其特征在于,在计算所述紧致程度之前,预先将所述读长簇对中位于所述读长簇对长度范围两端25%以内的所述读长的至少一部分排除。7.根据权利要求3所述的方法,其特征在于,所述线性相关性是通过对所述读长簇对所包含的读长进行t-test相关性检验而确定的。8.根据权利要求3所述的方法,其特征在于,在步骤(e)中进一步包括:(e-1)基于所述读长簇对中所含有的读长与所述基因组参考序列的匹配关系,确定所述结构变异的类型;(e-2)基于所述读长簇对中所含有的读长在所述基因组参考序列上的匹配位置,确定所述结构变异的断点范围。9.根据权利要求8所述的方法,其特征在于,在步骤(e-2)中,针对重复变异,选择在所述成对读长簇对中匹配到的距离最远的两个位置之间的范围并向外侧延伸预定距离,作为所述断点范围。10.根据权利要求8所述的方法,其特征在于,在步骤(e-2)中,针对缺失变异,选择在所述成对读长簇对中匹配到的距离最近的两个位置之间的范围并向内侧延伸预定距离,作为所述断点范围。11.根据权利要求8所述的方法,其特征在于,在步骤(e-2)中,包括:(e-2-1)选择这样的一对读长对,该读长对仅有一个读长存在于所述读长簇中;(e-2--2)将所选择的所述一对读长对中的另一个读长在所述基因组参考序列上的匹配位置作为所述断点范围。12.根据权利要求1所述的方法,其特征在于,在步骤(4)中,包括:对所述第二候选染色体异常类型集合和所述第三候选染色体异常类型集合中未在第一候选染色体异常类型集合中出现的候选染色体异常类型进行验证,排除未通过验证的候选染色体异常类型,以便获得经过过滤的第二候选染色体异常类型集合和经过过滤的第三候选染色体异常类型集合,所述经过过滤的第二候选染色体异常类型集合作为全基因组结果集合,所述经过过滤的第三候选染色体异常类型集合作为单细胞结果集合。13.根据权利要求12所述的方法,其特征在于,所述验证是通过PCR断点法、qPCR法和aCGH微阵列芯片法的至少之一进行的。14.根据权利要求12所述的方法,其特征在于,步骤(4)中包括:(a)基于所述全基因组结果集合和所述单细胞结果集合,确定仅存在于所述单细胞结果集合中的候选染色体异常类型;(b)采用突变类型已知的对照样本对步骤(3)进行平行实验验证;以及(c)如果所述平行实验的结果不多于所述对照样本的突变类型,则保留所述仅存在于所述单细胞结果集合中的候选染色体异常类型,如果所述平行实验的结果超过所述对照样本的突变类型,则从所述单细胞结果集合中去除仅存在于所述单细胞结果集合中的候选染色体异常类型,以便获得经过过滤的单细胞结果集合。15.根据权利要求12所述的方法,其特征在于,步骤(4)中包括:(a)基于所述全基因组结果集合和所述单细胞结果集合,确定仅存在于所述全基因组结果集合中的候选染色体异常类型;(b)采用突变类型已知的对照样本对步骤(2)进行平行实验验证;以及(c)如果所述平行实验的结果不多于所述对照样本的突变类型,则保留所述仅存在于所述全基因组结果集合中的候选染色体异常类型,如果所述平行实验的结果超过所述对照样本的突变类型,则从所述全基因组结果集合中去除仅存在于所述全基因组结果集合中的候选染色体异常类型,以便获得经过过滤的全基因组结果集合。16.根据权利要求12所述的方法,其特征在于,步骤(4)中包括:(i)基于所述全基因组结果集合和所述单细胞结果集合,确定仅存在于所述全基因组结果集合中的候选染色体异常类型;(ii)对所述组织样本重新进行步骤(2)的测序和分析,以便确认所述仅存在于所述全基因组结果集合中的候选染色体异常类型是否重复出现;以及(iii)如果所述仅存在于所述全基因组结果集合中的候选染色体异常类型重复出现,则保留所述仅存在于所述全基因组结果集合中的候选染色体异常类型,如果所述仅存在于所述全基因组结果集合中的候选染色体异常类型没有重复出现,则删除所述仅存在于所述全基因组结果集合中的候选染色体异常类型,以便获得经过过滤的全基因组结果集合。17.根据权利要求16所述的方法,其特征在于,在步骤(iii)中,如果所述仅存在于所述全基因组结果集合中的候选染色体异常类型没有重复出现,在调整步骤(2)的参数后,重复步骤(ii),如果所述仅存在于所述全基因组结果集合中的候选染色体异常类型没有重复出现,则删除所述仅存在于所述全基因组结果集合中的候选染色体异常类型。18.根据权利要求12所述的方法,其特征在于,步骤(4)中包括:(A)基于所述全基因组结果集合和所述单细胞结果集合,确定仅存在于所述全基因组结果集合中的候选染色体异常类型;(B)重新采集单细胞样本,并重复步骤(3)进行平行实验;以及(C)如果所述平行实验的结果中出现所述仅存在于所述全基因组结果集合中的候选染色体异常类型,则保留所述仅存在于所述全基因组结果集合中的候选染色体异常类型,如果所述平行实验中仍没有出现所述仅存在于所述全基因组结果集合中的候选染色体异常类型,则从所述全基因组结果集合中去除仅存在于所述全基因组结果集合中的候选染色体异常类型,以便获得经过过滤的全基因组结果集合。19.一种确定个体染色体结构异常的系统,其特征在于,包括:金标准检测单元,所述金标准检测单元用于利用核型分析和微阵列芯片分析的至少之一,确定所述个体的第一候选染...

【专利技术属性】
技术研发人员:徐凤萍王文婧叶玲飞杨振军袁剑颖徐金金
申请(专利权)人:深圳华大基因研究院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1