一种动态鉴定人类单细胞染色体拷贝数的方法技术

技术编号:34432007 阅读:58 留言:0更新日期:2022-08-06 16:10
本发明专利技术公开了一种基于二代测序数据的动态鉴定人类单细胞染色体拷贝数的方法,该方法可通过动态寻找最优的划分染色体拷贝数1、拷贝数2、拷贝数3的阈值,实现提高单细胞染色体拷贝数检测的准确率。拷贝数检测的准确率。拷贝数检测的准确率。

【技术实现步骤摘要】
一种动态鉴定人类单细胞染色体拷贝数的方法


[0001]本专利技术涉及医学检测领域,更为具体的,本专利技术涉及一种动态鉴定人类单细胞染色体拷贝数的方法。

技术介绍

[0002]单细胞基因组测序是鉴定人类胚胎及癌症单细胞中染色体拷贝数的重要技术手段。通过单细胞基因组扩增后进行二代测序,可以得到单细胞的基因组测序数据。进一步通过测序数据计算,可以获得单细胞的染色体拷贝数。在通过单细胞基因组测序数据计算染色体拷贝数的过程中,由于单细胞基因组测序数据的离散程度较大,在基因组上所得数据较为分散,而目前的多数计算方法都是设定一个固定的阈值来划分染色体拷贝数,将染色体划分为单体(拷贝数为1)、二倍体(拷贝数为2)、三倍体(拷贝数为3)。然而,由于不同批次和不同类型的单细胞测序数据分布不同,这种使用固定划分阈值的方法在确定染色体拷贝数方面存在一定的缺陷,并不是每一批单细胞测序数据均适合用软件设定的固定阈值来确定染色体的拷贝数。因此,在不同单细胞数据中,这种方法的准确性有较大波动。
[0003]目前针对单细胞基因组测序数据的染色体拷贝数的检测多使用上述方法本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于二代测序数据的动态鉴定人类单细胞染色体拷贝数的方法,其特征在于,所述方法包括如下步骤:(1)单细胞扩增并进行DNA二代测序;(2)步骤(1)所得测序数据,去除二代测序接头序列、低质量碱基,处理后数据比对至参考基因组,并去掉低比对质量序列以及PCR重复序列;(3)参考基因组窗口中比对序列计数及窗口GC含量、比对率统计:将参考基因组划分为连续的窗口,并计算每个窗口中比对的序列数,GC含量和可比对率;(4)窗口序列数矫正及观测值相对于理论值比例记为“copy ratio”,计算copy ratio的数值:对每个窗口的序列数进行GC含量和比对率的矫正,得到每个窗口矫正后的序列数,然后计算每条染色体上序列数的中位数;(5)利用获得的中位数计算观测值相对于理论拷贝数的比值copy ratio,并log2处理,得到log2(copy ratio),对所有样本的所有染色体的这些log2(copy ratio)的分布进行统计,并得到density分布图,找到染色体拷贝之间的最佳划分阈值,从而动态设定不同批次单细胞测序样本的最佳的染色体拷贝数划分阈值。2.如权利要求1所述的方法,其特征在于,步骤(1)中每个样本测序量为1 G数据量。3.如权利要求1所述的方法,其特征在于,步骤(2)的具体操作为:将步骤(1)所得测序数据,使用trim_galore质控软件默认参数去除二代测序接头序列、低质量碱基;仅保留处理后序列长度大于36 bp的序列;经过处理后的序列,使用BWA软件以默认参数比对至UCSC hg38人类参考基因组;比对后序列使用s...

【专利技术属性】
技术研发人员:严智强乔杰闫丽盈朱小辉宋石
申请(专利权)人:北京大学第三医院北京大学第三临床医学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1