【技术实现步骤摘要】
核基因组拷贝数变异检测方法及装置、设备、存储介质
[0001]本专利技术属于生物信息检测
,具体涉及一种核基因组拷贝数变异检测方法及装置、设备、存储介质。
技术介绍
[0002]宏基因临床检测技术是利用二代高通量测序从遗传物质角度对微生物感染进行鉴定和诊断的新型临床技术。其中高通量测序数据包含的微生物序列 (即非人源性序列)相对有限,超过90%的序列内容为人源性序列。但至今的临床应用中却仅使用了量较少的微生物序列进行感染学鉴定,量较多的人源性序列依然缺少应用和分析。宏基因技术利用游离核酸进行微生物鉴定,而肿瘤细胞因其高代谢率容易在游离核酸中检测到,游离核酸已经成为肿瘤筛查和检查的重要实验样本。如果通过宏基因在感染学检测的同时进行肿瘤或遗传病早筛检测,不但能够解决当前疾病问题,还能对肿瘤或遗传病早筛阳性结果提前介入和治疗,对人类健康有着巨大意义。但至今却极少联合宏基因和肿瘤基因拷贝数变异(Copy Number Variations,CNV)检测的算法和软件。因此通过宏基因感染的检测手段能够同时进行肿瘤或遗传病筛查的工作受技术限制无法进行。
[0003]目前针对CNV检测的主流理论包括Read
‑
Pair(RP)法、Split
‑
read(SR)法、 Read
‑
Depth(RD)法和Assembly(AS)法等4种方法。其中RP是最早出现的算法,利用双端测序插入片段长度分布来检测CNV,也称之为pair end mapping(PEM) 方法。当插入 ...
【技术保护点】
【技术特征摘要】
1.核基因组拷贝数变异检测方法,其特征在于,包括:从待测样本的测序数据中确定出多个指定位点的测序深度值;其中,每一所述指定位点对应有置信区间及RD设定均值;根据多个指定位点的测序深度值,判断所述待测样本是否为女性样本;若所述待测样本为女性样本,识别多个指定位点中的X染色体位点和常染色体位点;若任一X染色体位点的测序深度值的一半数值小于该X染色体位点对应的置信区间,确定该X染色体位点为低拷贝异常位点;若任一X染色体位点的测序深度值的一半数值大于该X染色体位点对应的置信区间,确定该X染色体位点为高拷贝异常位点;若任一常染色体位点的测序深度值小于该常染色体位点对应的置信区间,确定该常染色体位点为低拷贝异常位点;若任一常染色体位点的测序深度值大于该常染色体位点对应的置信区间,确定该常染色体位点为高拷贝异常位点;将所述低拷贝异常位点和所述高拷贝异常位点均作为拷贝异常位点;根据各个所述拷贝异常位点对应的RD设定均值以及测序深度值,计算各个所述拷贝异常位点的拷贝数值;其中,所述拷贝数值与所述测序深度值呈正相关关系;将所有所述拷贝异常位点的拷贝数值进行空间聚类分类,获得正常拷贝类和拷贝变异类,所述拷贝变异类包括两个拷贝变异子类,分别是高拷贝变异子类和低拷贝变异子类;将归属于所述高拷贝变异子类的高拷贝异常位点以及归属于所述低拷贝变异子类的低拷贝异常位点,分别确定为拷贝变异位点;将位置相邻且属于同一拷贝变异子类的拷贝变异位点进行合并,获得拷贝变异片段。2.如权利要求1所述的核基因组拷贝数变异检测方法,其特征在于,所述方法还包括:若所述待测样本不是女性样本,确定所述待测样本为男性样本,当任一指定位点的测序深度值小于该指定位点对应的置信区间,确定该指定位点为低拷贝异常位点;当任一指定位点的测序深度值大于该指定位点对应的置信区间,确定该指定位点为高拷贝异常位点。3.如权利要求1或2所述的核基因组拷贝数变异检测方法,其特征在于,所述指定位点对应的置信区间及RD设定均值通过以下步骤计算:获取多个训练样本的测序数据;所述测序数据包括M1个候选位点的测序深度值;多个训练样本包括多个女性训练样本和多个男性训练样本;对所有候选位点的测序深度值进行无监督聚类分类,获得多个分类类别;计算每一所述分类类别的第一测序深度均值;根据所述第一测序深度均值从多个分类类别中识别出噪音类别;将所述噪音类别所包括的候选位点剔除,获得M2个设定位点;识别M2个设定位点中的X染色体设定位点、Y染色体设定位点和常染色体设定位点;根据多个女性训练样本的测序数据的一半数值和多个男性训练样本的测序数据,计算每一所述X染色体设定位点的RD设定均值及方差;根据多个训练样本的测序数据,计算每一所述Y染色体设定位点的RD设定均值及方差;根据多个训练样本的测序数据,计算每一所述常染色体设定位点的RD设定均值及方差;从M2个设定位点中确定出全部或部分设定位点作为指定位点;
根据所述RD设定均值及方差,计算每一所述指定位点的置信区间。4.如权利要求3所述的核基因组拷贝数变异检测方法,其特征在于,所述根据多个女性训练样本的测序数据的一半数值和多个男性训练样本的测序数据,计算每一所述X染色体设定位点的RD设定均值及方差,包括:通过以下公式计算每一所述X染色体设定位点的RD设定均值及方差:通过以下公式计算每一所述X染色体设定位点的RD设定均值及方差:其中,为第w个X染色体设定位点的RD设定均值,Y1为女性训练样本的数量,Y2为男性训练样本的数量,RD
wy
为第y个训练样本在第w个X染色体设定位点上的测序深度值,S
sw2
为第w个X染色体设定位点的方差。5.如权利要求4所述的核基因组拷贝数变异检测方法,其特征在于,所述根据多个训练样本的测序数据,计算每一所述Y染色体设定位点的RD设定均值及方差,包括:通过以下公式计算每一所述Y染色体设定位点的RD设定均值及方差:通过以下公式计算每一所述Y染色体设定位点...
【专利技术属性】
技术研发人员:赵哲,韩雪莹,韦晨曦,申剑峰,刘学,
申请(专利权)人:郑州金域临床检验中心有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。