【技术实现步骤摘要】
一种基因组拷贝数变异的检测方法及包含该方法的装置
本专利技术涉及生物信息学
,尤其涉及一种基因组拷贝数变异的检测方法及包含该方法的装置。
技术介绍
拷贝数变异(Copynumbervariation,CNV)主要指基因组的DNA片段大小从1kb到几个Mb范围内的缺失、插入、重复等,包括数目异常和结构异常。拷贝数嵌合指的是染色体拷贝数变异数量介于整数之间,比如2.5倍的拷贝数变异为50%的三倍体嵌合。基因组拷贝数变异检测的应用领域除了科学研究外,在临床应用领域,拷贝数变异检测可用于单细胞拷贝数变异检测、流产物组织拷贝数变异检测、拷贝数变异的遗传病和肿瘤的检测等;其中单细胞拷贝数变异指的是分析单个细胞的拷贝数变异,比如单精子、单个受精卵细胞、单个卵细胞等。单细胞拷贝数变异检测的主要应用领域之一是胚胎植入前遗传学筛查(PreimplantationGeneticScreening,PGS)和胚胎植入前遗传学诊断(PreimplantationGeneticdiagnostics,PGD),主要对早期胚胎的单个细胞进行染色体拷贝数异常的检测,通过一次性检测胚胎23对染色体的结构和数目,分析胚胎是否有遗传物质异常的一种早期产前筛查/诊断方法,从而挑选正常的胚胎植入子宫,以期获得正常的妊娠,提高患者的临床妊娠率,降低胎儿患病风险。流产物组织拷贝数变异检测的目的是通过检测流产胎儿或胎盘样本,检测是不是胎儿基因组拷贝数变异导致的导致流产的。拷贝数变异的遗传病和肿瘤的检测主要是对病人进行基因组拷贝数变异检测用于发现导致遗传病/肿瘤的原因,并根据这些信息选择合适的药物进 ...
【技术保护点】
1.一种基因组拷贝数变异的检测方法,其特征在于,所述检测方法包括如下步骤:(1)获取样本的原始数据并进行质控和清理;(2)将步骤(1)得到的数据与参考基因组进行比对,排序并去重复;(3)将参考基因组分成至少两个大小不同的窗口,计算落入窗口的唯一比对的序列数;(4)统计落入步骤(3)所述窗口的GC含量,并进行GC校正;(5)将步骤(4)得到的GC矫正后的窗口计数结果的中位数的倒数作为权重进行参考校正;(6)将步骤(5)得到的数据进行CBS算法进行分段,找到基因组拷贝数相同的区域和不同的区域;(7)将步骤(6)得到的CBS分段结果针对单个窗口进行全基因组核型分析,得到初步核型结果;(8)将步骤(7)得到的不同大小窗口的核型结果进行整合,得到最终核型结果;(9)对步骤(1)‑(8)得到的数据进行加工处理整合,生成报告。
【技术特征摘要】
1.一种基因组拷贝数变异的检测方法,其特征在于,所述检测方法包括如下步骤:(1)获取样本的原始数据并进行质控和清理;(2)将步骤(1)得到的数据与参考基因组进行比对,排序并去重复;(3)将参考基因组分成至少两个大小不同的窗口,计算落入窗口的唯一比对的序列数;(4)统计落入步骤(3)所述窗口的GC含量,并进行GC校正;(5)将步骤(4)得到的GC矫正后的窗口计数结果的中位数的倒数作为权重进行参考校正;(6)将步骤(5)得到的数据进行CBS算法进行分段,找到基因组拷贝数相同的区域和不同的区域;(7)将步骤(6)得到的CBS分段结果针对单个窗口进行全基因组核型分析,得到初步核型结果;(8)将步骤(7)得到的不同大小窗口的核型结果进行整合,得到最终核型结果;(9)对步骤(1)-(8)得到的数据进行加工处理整合,生成报告。2.根据权利要求1所述的检测方法,其特征在于,步骤(1)所述样品包括单细胞DNA、少量混合的细胞DNA、痕量DNA或组织的基因组DNA中的任意一种或至少两种的组合;优选地,步骤(1)所述获取数据的测序仪包括Illumina平台、IonTorrent平台或DA8600平台的测序仪;优选地,步骤(1)所述数据的格式包括FASTQ和/或BAM格式;优选地,步骤(1)所述质控和清理的软件包括Trimmomatic、cutadapt、FASTQC或fastp中的任意一种或至少两种的组合。3.根据权利要求1或2所述的检测方法,其特征在于,步骤(2)所述参考基因组包括UCSChg19、UCSChg38、GRCh37或GRCh38中的任意一种或至少两种的组合;优选地,步骤(2)所述比对软件包括TMAP、BWA、Bowtie/Bowtie2、SOAP或SOAP2中的任意一种或至少两种的组合;优选地,步骤(2)所述排序和去重复所用软件包括Samtools、Picard或GATK中的任意一种或至少两种的组合;优选地,步骤(2)所述排序和去重复后得到的数据格式为BAM。4.根据权利要求1-3中任一项所述的检测方法,其特征在于,步骤(3)所述窗口大小包括1000K、500K、100K、50K、10K或1K中的至少两种的组合。5.根据权利要求1-4中任一项所述的检测方法,其特征在于,步骤(4)所述GC校正的方法包括局部加权回归散点平滑法或GC梯度变化的倒数权重法。6.根据权利要求1-5中任一项所述的检测方法,其特征在于,步骤(5)所述参考校正的值为该窗口GC校正后的值乘以参考数据每个窗口的权重;优选地,步骤(5)所述参考校正的步骤还包括屏蔽掉异常不可检测区域的步骤,所述异常不可检测区域的权重定义为0;优选地,所述异常不可检测区域包括窗口GC含量为0、参考计数的中位数为0或参考计数的变异系数大于0.2的数据窗口。7.根据权利要求1-6中任一项所述的检测方法,其特征在于,步骤(6)所述CBS分段采用的R语言软件包包括DNAcopy、seqCBS或PSCBS中的任意一种或至少两种的组合;优选地,步骤(6)所述CBS分...
【专利技术属性】
技术研发人员:李鹏,薄世平,陆思嘉,任军,
申请(专利权)人:上海亿康医学检验所有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。