拷贝数变异检测预处理装置、检测装置、判定装置和系统制造方法及图纸

技术编号:16919636 阅读:29 留言:0更新日期:2017-12-31 15:04
本发明专利技术提供了一种用于对捕获的目标区域上的基因进行拷贝数变异检测的预处理装置、检测装置、真伪判定装置以及系统,其中的预处理装置,其特征在于,包括:数据标准化部、基因相对拷贝数参数计算部以及外显子相对拷贝数参数计算部,其中,数据标准化部对正确比对数据进行标准化处理得到标准化数据;基因相对拷贝数参数计算部基于标准化数据并根据基因预定计算规则,计算得到基因的基因相对拷贝数参数;外显子相对拷贝数参数计算部基于标准化数据并根据外显子预定计算规则,逐一对一个基因的各个外显子计算得到与该基因相应的各个外显子相对拷贝数参数。

【技术实现步骤摘要】
拷贝数变异检测预处理装置、检测装置、判定装置和系统
本专利技术属于生物信息领域,具体涉及一种用于对捕获的目标区域上的基因进行拷贝数变异检测的预处理装置、检测装置、真伪判定装置以及系统。
技术介绍
伴随人类基因组数据的不断完善和二代测序成本的降低,与此同时,针对肿瘤治疗的靶向药物也越来越多,二代测序技术也随着精准医疗的推广和肿瘤治疗结合越来越紧密。目前,基于二代测序的研究主要集中在实体肿瘤组织测序、循环肿瘤DNA测序以及单细胞测序等技术,而实体肿瘤组织测序通过设计针对性的探针捕获目的区域(小片段/小panel)测序,是当前使用最广、精确度最好的技术,也被称作针对肿瘤测序的金标准,该方法为患者提供了高效精准的靶向药物选择方案,可使患者在更快获得靶向药物治疗的同时既赢得了时间也降低了不同种类靶向药之间选择的经济压力,可使患者更快更精准更便宜的获益,显著提高相关受益患者生存率。而在实体肿瘤组织测序中,拷贝数变异(CopyNumberVariants,CNV)扮演了很重要的角色。CNV一般指染色体上大于1Kb的片段发生丢失或重复的现象。CNV是一种广泛存在动植物基因组中的遗传多态,它的突变频率远高于SNP。然而,现有的CNV检测方法大多是针对全基因组或者全外显子组测序数据的,如CNV-seq,CNVnator,EXCAVATOR和Contra等。但是,上述方法均要做片段化处理,通过特定的统计学算法将拷贝数相似且相邻的区间合并成一个大片段,对该大片段进行检测,但是小panel测序的基因太少,且在染色体上的距离都很远,直接使用上述的方法会把距离很远的两个基因合并到一个片段,这种处理之后对小panel内各基因的特征显著性会大大降低,影响检出效率,所以不能适用上述方法进行CNV的检测。
技术实现思路
本专利技术提供一种用于对捕获的目标区域上的基因进行拷贝数变异检测的预处理装置、检测装置、真伪判定装置以及系统。为了实现上述目的,本专利技术采用了如下技术方案:本专利技术提供了一种拷贝数变异检测的预处理装置,对采用多个探针捕获样本得到的目标区域进行基因测序后并比对到参考基因组得到的正确比对数据进行处理得到能用于拷贝数变异检测得到检测结果或能用于对该检测结果进行真伪判定的数据或参数,其特征在于,包括:数据标准化部、基因相对拷贝数参数计算部以及外显子相对拷贝数参数计算部,其中,数据标准化部根据分别与探针分别对应的预定区间对正确比对数据进行标准化处理得到至少包括分别与不同的预定探针区间分别对应的探针测序深度值的与样本相应的标准化数据,预定区间为根据与不同探针分别对应的测序后得到的原始探针区间整理得到的相互之间没有重叠的区间;基因相对拷贝数参数计算部基于标准化数据,根据采用基因深度设定规则设定的与目标区域上的一个样本基因相应的基因测序深度、采用样本深度设定规则设定的与样本对应的样本测序深度,并根据基因预定计算规则,计算得到基因的基因相对拷贝数参数;外显子相对拷贝数参数计算部基于标准化数据,根据采用外显子深度设定规则设定的与外显子对应的外显子测序深度以及样本测序深度,并根据外显子预定计算规则,逐一对一个基因的各个外显子计算得到与该基因相应的各个外显子相对拷贝数参数。本专利技术提供的预处理装置,还具有这样的特征:其中,基因深度设定规则为:将属于同一个基因的所有探针测序深度值中为中位数的探针测序深度值设定为该基因的基因测序深度。本专利技术提供的预处理装置,还具有这样的特征:其中,样本深度设定规则为:将对目标区域测序得到的所有探针测序深度值中为中位数的探针测序深度设定为样本的样本测序深度。本专利技术提供的预处理装置,还具有这样的特征:其中,外显子深度设定规则为:将一个外显子的所有探针测序深度值中为中位数的探针测序深度值设定为相应外显子的外显子测序深度。本专利技术提供的预处理装置,还具有这样的特征:其中,基因预定计算规则为:当基因测序深度大于等于样本测序深度时,采用预定第一基因拷贝数公式计算基因相对拷贝数参数;当基因当基因测序深度小于样本测序深度时,采用预定第二基因拷贝数公式计算基因相对拷贝数参数。本专利技术提供的预处理装置,还具有这样的特征:其中,预定第一基因拷贝数公式为:gene_1copies=2×(1+(gene_depth-sample_depth)÷(sample_depth÷2))式中,gene_1copies表示第一基因相对拷贝数参数,gene_depth表示基因测序深度,sample_depth表示样本测序深度。本专利技术提供的预处理装置,还具有这样的特征:其中,预定第二基因拷贝数公式为:gene_2copies=2×(gene_depth÷sample_depth)式中,gene_2copies表示第二基因相对拷贝数参数,gene_depth表示基因测序深度,sample_depth表示样本测序深度。本专利技术提供的预处理装置,还具有这样的特征:其中,外显子预定计算规则为:当外显子测序深度大于等于样本测序深度时,采用预定第一外显子拷贝数公式计算外显子相对拷贝数参数;当外显子测序深度小于样本测序深度时,采用预定第二外显子拷贝数公式计算外显子相对拷贝数参数。本专利技术提供的预处理装置,还具有这样的特征:其中,预定第一外显子拷贝数公式为:exon_1copies=2×(1+(exon_depth-sample_depth)÷(sample_depth÷2))式中,exon_1copies表示第一外显子相对拷贝数参数,exon_depth表示外显子测序深度,sample_depth表示样本测序深度。本专利技术提供的预处理装置,还具有这样的特征:其中,预定第二外显子拷贝数公式为:exon_2copies=2×(exon_depth÷sample_depth)式中,exon_2copies表示第二外显子相对拷贝数参数,exon_depth表示外显子测序深度,sample_depth表示样本测序深度。本专利技术还提供一种检测装置,对捕获待测样本得到的样本目标区域上的样本基因进行拷贝数变异检测得到检测结果,其特征在于,包括:检测侧通信部、显著性检验计算部、显著性判断部、异常设定部、第一检测判断部、第一检测设定部、第二检测判断部、第二检测设定部、第三检测判断部、第三检测设定部、第四检测判断部、第四检测设定部以及检测结果判定部,检测侧通信部接收由预处理装置基于样本目标区域的样本正确比对数据处理得到的与所待测样本相应的至少含有不同样本探针测序深度值的样本标准化数据、与样本基因相应的样本基因相对拷贝数参数和各个样本外显子相对拷贝数参数;显著性检验计算部基于样本标准化数据,将属于同一个样本基因的所有探针测序深度值形成的基因集合,与不属于该样本基因的其它所有探针测序深度值形成的剩余深度集合之间做显著性检验计算得到与该样本基因相对应的检验结果;显著性判断部判断显著性检验结果是否满足大于等于0.05的显著条件;当判断满足显著条件时,异常设定部设定相应的样本基因为拷贝数异常基因;第一检测判断部判断一个样本基因的样本基因相对拷贝数参数是否满足大于等于3的第一变异条件;当判断满足第一变异条件时,第一检测设定部将相应的样本基因设定为第一变异条件基因;当判断不满足第一变异条件时,第二检测判断部判断样本基因相对本文档来自技高网
...
拷贝数变异检测预处理装置、检测装置、判定装置和系统

【技术保护点】
一种拷贝数变异检测的预处理装置,对采用多个探针捕获样本得到的目标区域进行基因测序后并比对到参考基因组得到的正确比对数据进行处理得到能用于拷贝数变异检测得到检测结果或能用于对该检测结果进行真伪判定的数据或参数,其特征在于,包括:数据标准化部、基因相对拷贝数参数计算部以及外显子相对拷贝数参数计算部,其中,所述数据标准化部根据分别与所述探针分别对应的预定区间对所述正确比对数据进行标准化处理得到至少包括分别与不同的所述预定探针区间分别对应的探针测序深度值的与所述样本相应的标准化数据,所述预定区间为根据与不同所述探针分别对应的测序后得到的原始探针区间整理得到的相互之间没有重叠的区间;所述基因相对拷贝数参数计算部基于所述标准化数据,根据采用基因深度设定规则设定的与所述目标区域上的一个样本基因相应的基因测序深度、采用样本深度设定规则设定的与所述样本对应的样本测序深度,并根据基因预定计算规则,计算得到所述基因的基因相对拷贝数参数;所述外显子相对拷贝数参数计算部基于所述标准化数据,根据采用外显子深度设定规则设定的与外显子对应的外显子测序深度以及所述样本测序深度,并根据外显子预定计算规则,逐一对一个所述基因的各个所述外显子计算得到与该基因相应的各个外显子相对拷贝数参数。...

【技术特征摘要】
1.一种拷贝数变异检测的预处理装置,对采用多个探针捕获样本得到的目标区域进行基因测序后并比对到参考基因组得到的正确比对数据进行处理得到能用于拷贝数变异检测得到检测结果或能用于对该检测结果进行真伪判定的数据或参数,其特征在于,包括:数据标准化部、基因相对拷贝数参数计算部以及外显子相对拷贝数参数计算部,其中,所述数据标准化部根据分别与所述探针分别对应的预定区间对所述正确比对数据进行标准化处理得到至少包括分别与不同的所述预定探针区间分别对应的探针测序深度值的与所述样本相应的标准化数据,所述预定区间为根据与不同所述探针分别对应的测序后得到的原始探针区间整理得到的相互之间没有重叠的区间;所述基因相对拷贝数参数计算部基于所述标准化数据,根据采用基因深度设定规则设定的与所述目标区域上的一个样本基因相应的基因测序深度、采用样本深度设定规则设定的与所述样本对应的样本测序深度,并根据基因预定计算规则,计算得到所述基因的基因相对拷贝数参数;所述外显子相对拷贝数参数计算部基于所述标准化数据,根据采用外显子深度设定规则设定的与外显子对应的外显子测序深度以及所述样本测序深度,并根据外显子预定计算规则,逐一对一个所述基因的各个所述外显子计算得到与该基因相应的各个外显子相对拷贝数参数。2.根据权利要求1所述的预处理装置,其特征在于:其中,所述基因深度设定规则为:将属于同一个基因的所有探针测序深度值中为中位数的所述探针测序深度值设定为该基因的基因测序深度。3.根据权利要求1所述的预处理装置,其特征在于:其中,所述样本深度设定规则为:将对所述目标区域测序得到的所有所述探针测序深度值中为中位数的所述探针测序深度值设定为所述样本的样本测序深度。4.根据权利要求1所述的预处理装置,其特征在于:其中,所述外显子深度设定规则为:将一个外显子的所有探针测序深度值中为中位数的所述探针测序深度值设定为相应外显子的外显子测序深度。5.根据权利要求1所述的预处理装置,其特征在于:其中,所述基因预定计算规则为:当所述基因测序深度大于等于所述样本测序深度时,采用预定第一基因拷贝数公式计算所述基因相对拷贝数参数;当所述基因当所述基因测序深度小于所述样本测序深度时,采用预定第二基因拷贝数公式计算所述基因相对拷贝数参数。6.根据权利要求5所述的预处理装置,其特征在于:其中,所述预定第一基因拷贝数公式为:gene_1copies=2×(1+(gene_depth-sample_depth)÷(sample_depth÷2))式中,gene_1copies表示基因相对拷贝数参数,gene_depth表示基因测序深度,sample_depth表示样本测序深度。7.根据权利要求5所述的预处理装置,其特征在于:其中,所述预定第二基因拷贝数公式为:gene_2copies=2×(gene_depth÷sample_depth)式中,gene_2copies表示基因相对拷贝数参数,gene_depth表示基因测序深度,sample_depth表示样本测序深度。8.根据权利要求1所述的预处理装置,其特征在于:其中,所述外显子预定计算规则为:当所述外显子测序深度大于等于所述样本测序深度时,采用预定第一外显子拷贝数公式计算所述外显子相对拷贝数参数;当所述外显子测序深度小于所述样本测序深度时,采用预定第二外显子拷贝数公式计算所述外显子相对拷贝数参数。9.根据权利要求8所述的预处理装置,其特征在于:其中,所述预定第一外显子拷贝数公式为:exon_1copies=2×(1+(exon_depth-sample_depth)÷(sample_depth÷2))式中,exon_1copies表示第一外显子相对拷贝数参数,exon_depth表示外显子测序深度,sample_depth表示样本测序深度。10.根据权利要求8所述的预处理装置,其特征在于:其中,所述预定第二外显子拷贝数公式为:exon_2copies=2×(exon_depth÷sample_depth)式中,exon_2copies表示第二外显子相对拷贝数参数,exon_depth表示外显子测序深度,sample_depth表示样本测序深度。11.一种拷贝数变异检测的检测装置,对捕获待测样本得到的样本目标区域上的样本基因进行拷贝数变异检测得到检测结果,其特征在于,包括:检测侧通信部、显著性检验计算部、显著性判断部、异常设定部、第一检测判断部、第一检测设定部、第二检测判断部、第二检测设定部、第三检测判断部、第三检测设定部、第四检测判断部、第四检测设定部以及检测结果判定部,所述检测侧通信部接收由预处理装置基于所述样本目标区域的样本正确比对数据处理得到的与所待测样本相应的至少含有不同样本探针测序深度值的样本标准化数据、与所述样本基因相应的样本基因相对拷贝数参数和各个样本外显子相对拷贝数参数;所述显著性检验计算部基于所述样本标准化数据,将属于同一个所述样本基因的所有所述探针测序深度值形成的基因集合,与不属于该样本基因的其它所有所述探针测序深度值形成的剩余深度集合之间做显著性检验计算得到与该样本基因相对应的检验结果;所述显著性判断部判断所述显著性检验结果是否满足大于等于0.05的显著条件;当判断满足所述显著条件时,所述异常设定部设定相应的所述样本基因为拷贝数异常基因;所述第一检测判断部判断一个所述样本基因的样本基因相对拷贝数参数是否满足大于等于3的第一变异条件;当判断满足所述第一变异条件时,所述第一检测设定部将相应的所述样本基因设定为第一变异条件基因;当判断不满足所述第一变异条件时,所述第二检测判断部判断所述样本基因相对拷贝数参数是否满足小于等于1的第二变异条件;当判断满足所述第二变异条件时,所述第检测二设定部将相应的所述样本基因设定为第二变异条件基因;第三检测判断部根据一个所述样本基因的各个所述样本外显子在染色体上的顺序,并判断是否满足该样本基因的所有样本外显子拷贝数大于等于3对应的所有所述样本外显子中在所述染色体上的顺序为连续的所有所述样本外显子的数量大于等于该样本基因的所有所述样本外显子的总个数的三分之二的第三变异条件;当满足所述第三变异条件时,所述第三检测设定部将相应的所述样本基因设定为第三变异条件基因;当所述第三检测判断部判断不满足所述第三变异条件时,所述第四检测判断部根据各个所述...

【专利技术属性】
技术研发人员:姚继成秦公炜王凯
申请(专利权)人:至本医疗科技上海有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1