The invention provides a method and device for correcting sequencing depth, which includes: acquisition module for acquiring GC content of each locus in genome and sequencing depth of all loci in genome; division module for dividing all loci into N different intervals according to specified rules according to GC content of each locus, in which N is a positive integer. The module is used to determine the Poisson distribution of the average sequencing depth of N intervals; the processing module is used to arrange the values of the Poisson distribution and the sequencing depth of all the sites in the same arrangement, and the values of the Poisson distribution after arrangement are used as the sequencing depth of each site after correction.
【技术实现步骤摘要】
测序深度的矫正方法及装置
本专利技术涉及通信领域,具体而言,涉及一种测序深度的矫正方法及装置。
技术介绍
一些研究表明,通过扩增和测序引入的GC偏差对染色体非整倍性的敏感性产生了限制作用。在不同测序条件下,例如试剂成分不同、测序温度不同或者簇密度不同,GC偏差可能在样品制备和测序过程中引入,这会导致GC含量过高或GC含量过低的基因组区域的测序数据出现偏差。相关技术中开发了消除GC偏差的计算方法。HCFan和SRQuake开发了一种通过局部多项式回归拟合(LOESS回归)的计算方法消除GC偏差,该方法通过基于局部基因组GC含量对每个GC密度给予权重,以通过乘以相应权重矫正每个区域的Reads数目。但是,该方法在计算时可能造成数据轻微失真,会干扰检测的准确性。针对相关技术中,通过局部多项式回归拟合的计算方法来消除测序深度的偏差的方法,容易出现数据失真,结果准确性差等问题,尚未提出有效的技术方案。
技术实现思路
本专利技术实施例提供了一种测序深度的矫正方法及装置,以至少解决相关技术中通过局部多项式回归拟合的计算方法来消除测序深度的偏差的方法,容易出现数据失真,结果准确性差等 ...
【技术保护点】
1.一种测序深度的矫正装置,其特征在于,包括:获取模块,用于获取基因组上每个位点的GC含量,以及所述基因组的所有位点的测序深度;划分模块,用于根据每个位点的GC含量将所述所有位点按照指定规则分成N个不同区间,其中,N为正整数;确定模块,用于确定N个区间的平均测序深度的泊松分布;处理模块,用于将所述泊松分布的值和所述所有位点的测序深度按照相同的排列方式进行排列,并将排列后的泊松分布的值作为矫正后的每个位点的测序深度。
【技术特征摘要】
1.一种测序深度的矫正装置,其特征在于,包括:获取模块,用于获取基因组上每个位点的GC含量,以及所述基因组的所有位点的测序深度;划分模块,用于根据每个位点的GC含量将所述所有位点按照指定规则分成N个不同区间,其中,N为正整数;确定模块,用于确定N个区间的平均测序深度的泊松分布;处理模块,用于将所述泊松分布的值和所述所有位点的测序深度按照相同的排列方式进行排列,并将排列后的泊松分布的值作为矫正后的每个位点的测序深度。2.根据权利要求1所述的装置,其特征在于,所述划分模块,用于将GC含量落在第一范围内的位点化分在N个不同区间的两端区间内;以及将GC含量落在第二范围内的位点化分在中间区间内,其中,中间区间为所述N个不同区间中,除所述两端区间的其他区间,所述第一范围内的位点数目小于所述第二范围内的位点数目。3.根据权利要求1所述的装置,其特征在于,所述处理模块,还用于将所述排列后的泊松分布的值替换所述所有位点的测序深度,将替换后的所有位点的测序深度作为所述矫正后的每个位点的测序深度。4.根据权利要求1所述的装置,其特征在于,所述处理模块,还用于将所述泊松分布的值和所述所有位点的测序深度均按照从小到大的顺序排列,或还用于将所述泊松分布的值和所述所有位点的测序深度按照从大到小的顺序排列。5.根据权利要求1所述的装置,其特征在于,所述确定模块,还用于通过以下方式确定所述N个区间的平均深度:将所述基因组内所有位点的总深度除以所述基因组内位点的个数,得到所述N个区间的平均深度。6.根据权利要求1所述的装置,其...
【专利技术属性】
技术研发人员:张静波,柴景超,伍启熹,王建伟,刘倩,刘珂弟,唐宇,
申请(专利权)人:北京优迅医学检验实验室有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。