The invention provides a method for determining the structural abnormalities of individual chromosomes. The method includes: (1) using karyotype analysis and at least one of microarray chip analysis to determine the first candidate chromosome structural abnormality type of the individual, so as to obtain the first candidate chromosome abnormality type set; (2) genome-wide sequencing of the tissue samples of the individual, and the first data analysis of the sequencing results, so as to obtain the second candidate chromosome. Abnormal type sets; (3) Genome-wide sequencing of the individual's single cell samples, and second data analysis of the sequencing results, in order to obtain the third candidate chromosome abnormal type set; (4) Based on the first candidate chromosome abnormal type set, the second candidate chromosome abnormal type set and the third candidate chromosome abnormal type set, the above mentioned method is determined. The final type of chromosomal structural abnormality of an individual.
【技术实现步骤摘要】
确定个体染色体结构异常的方法和系统
本专利技术涉及生物检测领域,具体地,本专利技术涉及确定个体染色体结构异常的方法和系统。
技术介绍
染色体变异在影响人类健康中发挥着至关重要的作用,尤其与智力发育、癌症、不孕不育等疾病的发生有密切关联。自1971年巴黎国际染色体命名会议以来,已发现人类染色体数目异常和结构畸变3000余种,目前已确认染色体病综合征100余种,智力低下和生长发育迟滞是染色体病的共同特征。Down综合征(Down’ssyndrome)是人类最常见的染色体疾病,其他已知的染色体综合症疾病包括DiGeorge综合症、Patau综合征、Williams综合征、Prader-Willi和Angelman综合征等。而染色体其他类型的结构畸变如易位(translocation)、倒位(inversion)甚至是染色体的碎裂(chromothripis)也是致病致死的重要原因之一。2012年Talkowski团队报道了一例胎儿患有CHARGE综合症而死胎,其原因为6号和8号染色体的自发性平衡易位导致基因CHD7基因融合而功能失活。对植入前胚胎、孕妇进行相应的检测手段可以及时发现进而采取相应的干预措施,可以显著降低新生儿的出生缺陷率,提高人口的优生率。另一方面,染色体的畸变以及因畸变而形成的融合基因也是癌症的发生发展重要机制之一。1960年第一个融合基因就被Nowell和Hungerford等在白血病慢性髓细胞性白血病的白细胞中发现。而至今已有多种融合基因被认定为肿瘤的致病突变,如前列腺癌中的TMRPSS2-ERG在高加索人中达到50%。因此,通过早期无创的检 ...
【技术保护点】
1.一种确定个体染色体结构异常的方法,其特征在于,包括:(1)利用核型分析和微阵列芯片分析的至少之一,确定所述个体的第一候选染色体结构异常类型,以便获得第一候选染色体异常类型集合,所述第一候选染色体异常类型集合作为金标准结果集合;(2)对所述个体的组织样本进行全基因组测序,并对所得到的测序结果进行第一数据分析,以便获得第二候选染色体异常类型集合,优选地,所述组织样本为血液样本;(3)对所述个体的单细胞样本进行全基因组测序,并对所得到的测序结果进行第二数据分析,以便获得第三候选染色体异常类型集合,优选地,所述细胞样本为淋巴细胞样本;(4)基于所述第一候选染色体异常类型集合、第二候选染色体异常类型集合和第三候选染色体异常类型集合,确定所述个体的最终染色体结构异常类型。
【技术特征摘要】
1.一种确定个体染色体结构异常的方法,其特征在于,包括:(1)利用核型分析和微阵列芯片分析的至少之一,确定所述个体的第一候选染色体结构异常类型,以便获得第一候选染色体异常类型集合,所述第一候选染色体异常类型集合作为金标准结果集合;(2)对所述个体的组织样本进行全基因组测序,并对所得到的测序结果进行第一数据分析,以便获得第二候选染色体异常类型集合,优选地,所述组织样本为血液样本;(3)对所述个体的单细胞样本进行全基因组测序,并对所得到的测序结果进行第二数据分析,以便获得第三候选染色体异常类型集合,优选地,所述细胞样本为淋巴细胞样本;(4)基于所述第一候选染色体异常类型集合、第二候选染色体异常类型集合和第三候选染色体异常类型集合,确定所述个体的最终染色体结构异常类型。2.根据权利要求1所述的方法,其特征在于,所述染色体结构异常包括结构变异SV和拷贝数变异CNV的至少之一。3.根据权利要求1所述的方法,其特征在于,所述第一数据分析和所述第二数据分析的至少之一是通过下列步骤进行的:(a)将所述测序结果与基因组参考序列比对,所述测序结果由多对读长对构成;(b)基于步骤(a)的比对结果,确定所述多对读长对的每一对在所述基因组参考序列上的物理距离;(c)基于步骤(b)中获得的所述物理距离,将所述多对读长对区分为正常匹配集合和异常匹配集合;(d)将所述异常匹配集合中的读长进行聚类,以便获得多对读长簇对;(e)基于各读长簇对中所含有读长的紧致程度和线性相关性,对所述多对读长簇对进行过滤;以及(f)基于所述的经过过滤的多对读长簇对,确定染色体结构异常的断点和染色体异常类型。4.根据权利要求3所述的方法,其特征在于,在步骤(c)中,通过将所述物理距离与预定的核酸片段长度相比较,将所述多对读长对区分为正常匹配集合和异常匹配集合,其中,所述预定的核酸长度是基于所述全基因组测序的插入片段大小而确定的。5.根据权利要求3所述的方法,其特征在于,所述紧致程度是基于下列公式确定的:其中,x1,x2,x3…xn表示读长簇的reads的位置,n表示读长条数,M表示位置的平均值,s2表示方差。6.根据权利要求5所述的方法,其特征在于,在计算所述紧致程度之前,预先将所述读长簇对中位于所述读长簇对长度范围两端25%以内的所述读长的至少一部分排除。7.根据权利要求3所述的方法,其特征在于,所述线性相关性是通过对所述读长簇对所包含的读长进行t-test相关性检验而确定的。8.根据权利要求3所述的方法,其特征在于,在步骤(e)中进一步包括:(e-1)基于所述读长簇对中所含有的读长与所述基因组参考序列的匹配关系,确定所述结构变异的类型;(e-2)基于所述读长簇对中所含有的读长在所述基因组参考序列上的匹配位置,确定所述结构变异的断点范围。9.根据权利要求8所述的方法,其特征在于,在步骤(e-2)中,针对重复变异,选择在所述成对读长簇对中匹配到的距离最远的两个位置之间的范围并向外侧延伸预定距离,作为所述断点范围。10.根据权利要求8所述的方法,其特征在于,在步骤(e-2)中,针对缺失变异,选择在所述成对读长簇对中匹配到的距离最近的两个位置之间的范围并向内侧延伸预定距离,作为所述断点范围。11.根据权利要求8所述的方法,其特征在于,在步骤(e-2)中,包括:(e-2-1)选择这样的一对读长对,该读长对仅有一个读长存在于所述读长簇中;(e-2--2)将所选择的所述一对读长对中的另一个读长在所述基因组参考序列上的匹配位置作为所述断点范围。12.根据权利要求1所述的方法,其特征在于,在步骤(4)中,包括:对所述第二候选染色体异常类型集合和所述第三候选染色体异常类型集合中未在第一候选染色体异常类型集合中出现的候选染色体异常类型进行验证,排除未通过验证的候选染色体异常类型,以便获得经过过滤的第二候选染色体异常类型集合和经过过滤的第三候选染色体异常类型集合,所述经过过滤的第二候选染色体异常类型集合作为全基因组结果集合,所述经过过滤的第三候选染色体异常类型集合作为单细胞结果集合。13.根据权利要求12所述的方法,其特征在于,所述验证是通过PCR断点法、qPCR法和aCGH微阵列芯片法的至少之一进行的。14.根据权利要求12所述的方法,其特征在于,步骤(4)中包括:(a)基于所述全基因组结果集合和所述单细胞结果集合,确定仅存在于所述单细胞结果集合中的候选染色体异常类型;(b)采用突变类型已知的对照样本对步骤(3)进行平行实验验证;以及(c)如果所述平行实验的结果不多于所述对照样本的突变类型,则保留所述仅存在于所述单细胞结果集合中的候选染色体异常类型,如果所述平行实验的结果超过所述对照样本的突变类型,则从所述单细胞结果集合中去除仅存在于所述单细胞结果集合中的候选染色体异常类型,以便获得经过过滤的单细胞结果集合。15.根据权利要求12所述的方法,其特征在于,步骤(4)中包括:(a)基于所述全基因组结果集合和所述单细胞结果集合,确定仅存在于所述全基因组结果集合中的候选染色体异常类型;(b)采用突变类型已知的对照样本对步骤(2)进行平行实验验证;以及(c)如果所述平行实验的结果不多于所述对照样本的突变类型,则保留所述仅存在于所述全基因组结果集合中的候选染色体异常类型,如果所述平行实验的结果超过所述对照样本的突变类型,则从所述全基因组结果集合中去除仅存在于所述全基因组结果集合中的候选染色体异常类型,以便获得经过过滤的全基因组结果集合。16.根据权利要求12所述的方法,其特征在于,步骤(4)中包括:(i)基于所述全基因组结果集合和所述单细胞结果集合,确定仅存在于所述全基因组结果集合中的候选染色体异常类型;(ii)对所述组织样本重新进行步骤(2)的测序和分析,以便确认所述仅存在于所述全基因组结果集合中的候选染色体异常类型是否重复出现;以及(iii)如果所述仅存在于所述全基因组结果集合中的候选染色体异常类型重复出现,则保留所述仅存在于所述全基因组结果集合中的候选染色体异常类型,如果所述仅存在于所述全基因组结果集合中的候选染色体异常类型没有重复出现,则删除所述仅存在于所述全基因组结果集合中的候选染色体异常类型,以便获得经过过滤的全基因组结果集合。17.根据权利要求16所述的方法,其特征在于,在步骤(iii)中,如果所述仅存在于所述全基因组结果集合中的候选染色体异常类型没有重复出现,在调整步骤(2)的参数后,重复步骤(ii),如果所述仅存在于所述全基因组结果集合中的候选染色体异常类型没有重复出现,则删除所述仅存在于所述全基因组结果集合中的候选染色体异常类型。18.根据权利要求12所述的方法,其特征在于,步骤(4)中包括:(A)基于所述全基因组结果集合和所述单细胞结果集合,确定仅存在于所述全基因组结果集合中的候选染色体异常类型;(B)重新采集单细胞样本,并重复步骤(3)进行平行实验;以及(C)如果所述平行实验的结果中出现所述仅存在于所述全基因组结果集合中的候选染色体异常类型,则保留所述仅存在于所述全基因组结果集合中的候选染色体异常类型,如果所述平行实验中仍没有出现所述仅存在于所述全基因组结果集合中的候选染色体异常类型,则从所述全基因组结果集合中去除仅存在于所述全基因组结果集合中的候选染色体异常类型,以便获得经过过滤的全基因组结果集合。19.一种确定个体染色体结构异常的系统,其特征在于,包括:金标准检测单元,所述金标准检测单元用于利用核型分析和微阵列芯片分析的至少之一,确定所述个体的第一候选染...
【专利技术属性】
技术研发人员:徐凤萍,王文婧,叶玲飞,杨振军,袁剑颖,徐金金,
申请(专利权)人:深圳华大基因研究院,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。