System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种检测地中海贫血患者拷贝数变异类型的方法及装置制造方法及图纸_技高网

一种检测地中海贫血患者拷贝数变异类型的方法及装置制造方法及图纸

技术编号:40574690 阅读:6 留言:0更新日期:2024-03-06 17:15
本发明专利技术属于生物信息学领域,具体而言,涉及一种检测地中海贫血患者拷贝数变异类型的方法及装置,本发明专利技术所述方法包括自建地贫拷贝数变异数据库、构建健康人群的地中海贫血相关基因的拷贝数基线数据库、使用待测样本拷贝数发生变化的区域范围及该区域拷贝数,结合自建地贫拷贝数变异数据库判断该样本所属的地中海贫血拷贝数变异类型;本发明专利技术可以明确检测出样本所携带的与地中海贫血相关的已知结构变异,并能准确探明非典型的地中海贫血相关基因组结构变异;经验证,依标准使用本方法可以用于检测已知的地中海贫血拷贝数变异类型及发现新的地中海贫血拷贝数变异类型。

【技术实现步骤摘要】

本专利技术属于生物信息学领域,具体而言,涉及一种检测地中海贫血患者拷贝数变异类型的方法及装置


技术介绍

1、地中海贫血(以下简称为地贫)是一种常见的单基因疾病,由α或β珠蛋白基因的致病性变异引发,这些变异导致α和β珠蛋白链之间的平衡失调。传统的地贫(以及其他血红蛋白病)的检测方法首先进行血液学测试,例如测定平均红细胞血红蛋白(hb)和平均红细胞体积等指标,接着进行hb电泳,最后通过基因测试来明确具体的致病变异。尽管在大多数情况下这一流程效果显著,但却需要耗费大量实验室工作和根据具体情况逐步制定决策,这使得大规模检测变得颇为繁琐。在某些罕见情况下,一些疾病突变可能不会呈现出血液学上的阳性特征,导致可能存在假阴性的血液学筛查情况。

2、珠蛋白基因的新发突变或复杂结构变化是遗传咨询和产前诊断领域的主要挑战。目前,为了预防地贫等相关疾病,携带者筛查和产前检测被视为首选的防护措施。传统的突变检测方法需要使用多种技术来分析各种类型的基因突变。然而,基于靶向富集的ngs技术能够显著提高突变检测的效率。相较于多重扩增子,探针杂交捕获更为高效,其具有以下优势:①可检测到常见和不常见的突变;②在大规模人群筛查中更具成本效益;③能够降低患者突变被误诊或漏诊的风险。

3、α-珠蛋白基因簇位于染色体16p13.3区域,该区域具备一系列独特特征,包括同源序列、散在重复序列以及各种类型的遗传变异。由于这种序列的同源性,ngs测序的片段通常会映射到多个不同位置,而不是唯一的位置。这不仅会造成点突变和插入/缺失突变(indels)的漏检,还会导致测序深度的不准确性,然而测序深度对于检测结构变异(svs)是至关重要的。此外,在地贫流行地区,复合型结构变异的出现相当常见。例如,--sea/-α3.7是一种导致hb h病的复杂杂合基因型,在中国香港和其他一些东南亚地区广泛存在。然而是市场上对于检测复杂杂合基因尤其是结构变异的方法罕有报道,因此,利用生信分析工具准确检测这些复杂基因型对于全面实施地贫分子诊断和携带者筛查至关重要。


技术实现思路

1、针对上述问题,本专利技术公开了一种检测地中海贫血患者拷贝数变异类型的方法,包括以下步骤:

2、s1.收集hbvar数据库、lovd数据库、itha数据库中与地贫拷贝数相关的变异信息,去冗余后自建地贫拷贝数变异数据库;

3、s2.通过杂交探针捕获健康人群中与地中海贫血相关基因的核酸序列,进行高通量测序,以构建健康人群的地中海贫血相关基因的拷贝数基线数据库;

4、s3.通过杂交探针捕获待鉴定样本中的核酸序列,进行高通量测序,与人类参考基因组比对后利用softclip判断样本基因组中可能发生拷贝数变异的区域的断点;

5、s4.利用步骤s3中待鉴定样本测序数据,与步骤s2中的基线数据库进行比较,选定该样本适用的拷贝数参考基线;

6、s5.利用步骤s3中待鉴定样本测序数据与步骤s4确定的拷贝数参考基线比较得到拷贝数变化疑似断点区域;

7、s6.结合步骤s3中区域断点信息及步骤s5中拷贝数变化疑似断点区域,确定待测样本拷贝数发生变化的区域范围及该区域拷贝数变化类型;

8、s7.使用步骤s6中待测样本拷贝数发生变化的区域范围及该区域拷贝数,结合步骤s1中自建地贫拷贝数变异数据库判断该样本所属的地中海贫血拷贝数变异类型。

9、进一步地,步骤s2中,用来构建拷贝数基线数据库的健康人数为x,对所述x份样本分别进行捕获测序,并计算捕获区间各位点深度,以w bp为标准滑窗大小,s bp为步移长度,步移计算每个样本捕获区间内每个标准滑窗内平均深度,得到x份参考深度集合。在参考深度集合中随机抽取x’个样本,要求x’大于1/2x且小于x-1,重复m次,构成m个参考深度备选库,计算每个备选库内所有样本在上述每一个标准滑窗内的平均深度构成标准滑窗内的平均深度集,并计算所有样本的捕获区间整体平均深度,得到m个标准滑窗内的平均深度集及其对应的捕获区间整体平均深度,构成拷贝数基线数据库。

10、进一步地,步骤s3中,利用待鉴定样本捕获测序结果,与参考基因组进行比对,提取比对结果文件中含有softclip的read,选择softclip长度大于一定值的read,记录其softclip发生的位置为断点a,同时a点可信read数ar=ar+1,提取该read的softclip序列,在该read比对到的染色体上再次进行比对,比对到的位置为断点b,同时b点可信read数br=br+1。当可信read数ar与br均大于一定值时,认为a点与b点为发生拷贝数变异的区域的两端断点,a点位置与b点位置配对成ab配对点集。当ar或br中仅有一个read数大于一定值时,单独记录a点位置或b点位置成ab单点集。对ab配对点集内每个配对点的拷贝数变异类型进行预设,预设值形式为f-r-r’-f’,其中f和r的取值范围均为0~4的整数,r=r’,f=f’,|r-f|≤2。对ab单点集内每个点的拷贝数变异类型进行预设,预设值形式为f-r,其中f和r的取值范围均为0~4的整数且|r-f|≤2。

11、进一步地,步骤s4中,利用待鉴定样本捕获测序结果,计算捕获区间内各位点深度,以w bp为标准滑窗大小,s bp为步移长度,步移计算每个样本每个标准滑窗内平均深度及捕获区间整体平均深度,得到待测样本每个标准滑窗平均深度及待测样本平均深度。其中,w与s与构建拷贝数基线数据库时的w与s一致。使用待测样本平均深度与拷贝数基线数据库中每一个捕获区间整体平均深度做差,差值最小的捕获区间整体平均深度及其对应的标准滑窗内的平均深度集为待测样本拷贝数参考基线。

12、进一步地,步骤s5中,利用待测样本平均深度与待测样本拷贝数参考基线,计算待测样本每个标准滑窗区域的拷贝数。以标准滑窗的gc含量在一定范围内为标准,记录符合该标准的标准滑窗位置,使用这些标准滑窗位置对应的标准滑窗区域的拷贝数计算均值,并与gc矫正锚点2拷贝做差,其结果值为矫正偏移量,以此对待测样本的标准滑窗区域的拷贝数进行拷贝数矫正,以矫正后拷贝数代替原拷贝数。更进一步地,每条染色体分别计算矫正偏移量,并分别矫正每条染色体。

13、进一步地,步骤s5中,以标准滑窗位置进行排序,当相邻标准滑窗的矫正后拷贝数差在一定范围内时,合并相邻标准滑窗为bin滑窗,并重新计算bin滑窗内平均拷贝数。当相邻的bin滑窗平均拷贝数差超出一定范围时,记录bin滑窗内首尾两个标准滑窗的平均拷贝数整数位数值,当首尾标准滑窗平均拷贝数整数位数值不同时,若首标准滑窗上游5个bin滑窗的平均拷贝数与首滑窗平均拷贝数差的绝对值小于0.5,则首标准滑窗拷贝数为真,同时若尾标准滑窗下游5个bin滑窗的平均拷贝数与尾滑窗平均拷贝数差的绝对值小于0.5,则尾标准滑窗拷贝数为真,首尾标准滑窗拷贝数均为真时合并该相邻bin滑窗,为可用bin滑窗,记录前后bin滑窗合并时相连的标准滑窗的区域c’,其位置中点为c。更进一步地,当c本文档来自技高网...

【技术保护点】

1.一种检测地中海贫血患者拷贝数变异类型的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述步骤S2包括以下步骤:构建拷贝数基线数据库:

3.根据权利要求1所述的方法,其特征在于,所述步骤S3包括以下步骤:利用softclip判断可能发生拷贝数变异的区域的断点:利用待鉴定样本捕获测序结果,与参考基因组进行比对,提取比对结果文件中含有softclip的read,选择softclip长度大于一定值的read,记录其soffclip发生的位置为断点A,同时A点可信read数AR=AR+1,提取该read的softclip序列,在该read比对到的染色体上再次进行比对,比对到的位置为断点B,同时B点可信read数BR=BR+1;当可信read数AR与BR均大于一定值时,认为A点与B点为发生拷贝数变异的区域的两端断点,A点位置与B点位置配对成AB配对点集;当AR或BR中仅有一个read数大于一定值时,单独记录A点位置或B点位置成AB单点集;

4.根据权利要求1所述的方法,其特征在于,所述步骤S4包括以下步骤:选定待鉴定样本适用的拷贝数参考基线:利用待鉴定样本捕获测序结果,计算捕获区间内各位点深度,以W bp为标准滑窗大小,S bp为步移长度,步移计算每个样本每个标准滑窗内平均深度及捕获区间整体平均深度,得到待测样本每个标准滑窗平均深度及待测样本平均深度,其中,W与S与权利要求2中W与S一致;

5.根据权利要求1所述的方法,其特征在于,所述步骤S5包括以下步骤:确定拷贝数变化疑似断点区域,利用待测样本平均深度与待测样本拷贝数参考基线,计算待测样本每个标准滑窗区域的拷贝数;

6.根据权利要求1所述的方法,其特征在于,所述步骤S6包括以下步骤:确定待测样本拷贝数发生变化的区域范围及该区域拷贝数变化类型:

7.根据权利要求1所述的方法,其特征在于,所述步骤S7包括以下步骤:结合自建地贫拷贝数变异数据库判断样本所属的地中海贫血拷贝数变异类型:

8.一种检测地中海贫血患者拷贝数变异类型的装置,其特征在于,应用如权利要求1-7任一项所述的方法;

...

【技术特征摘要】

1.一种检测地中海贫血患者拷贝数变异类型的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述步骤s2包括以下步骤:构建拷贝数基线数据库:

3.根据权利要求1所述的方法,其特征在于,所述步骤s3包括以下步骤:利用softclip判断可能发生拷贝数变异的区域的断点:利用待鉴定样本捕获测序结果,与参考基因组进行比对,提取比对结果文件中含有softclip的read,选择softclip长度大于一定值的read,记录其soffclip发生的位置为断点a,同时a点可信read数ar=ar+1,提取该read的softclip序列,在该read比对到的染色体上再次进行比对,比对到的位置为断点b,同时b点可信read数br=br+1;当可信read数ar与br均大于一定值时,认为a点与b点为发生拷贝数变异的区域的两端断点,a点位置与b点位置配对成ab配对点集;当ar或br中仅有一个read数大于一定值时,单独记录a点位置或b点位置成ab单点集;

4.根据权利要求1所述...

【专利技术属性】
技术研发人员:蒋才尹书剑程陶然毛艳朱文鑫
申请(专利权)人:纳昂达南京生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1