测序深度的矫正方法及装置制造方法及图纸

技术编号:20871279 阅读:25 留言:0更新日期:2019-04-17 10:20
本发明专利技术提供了一种测序深度的矫正方法及装置,其中,上述装置包括:获取模块,用于获取基因组上每个位点的GC含量,以及所述基因组的所有位点的测序深度;划分模块,用于根据每个位点的GC含量将所述所有位点按照指定规则分成N个不同区间,其中,N为正整数;第一确定模块,用于确定每个区间内所有位点的测序深度的第一泊松分布律,以及N个区间的平均测序深度的第二泊松分布律;转换模块,用于根据所述第一泊松分布律和所述第二泊松分布律对所有位点的测序深度的值进行转换,以使对于同一测序深度值,所述第一泊松分布律与所述第二泊松分布律相同;第二确定模块,用于将转换后的所有位点的测序深度作为矫正后的测序深度。

【技术实现步骤摘要】
测序深度的矫正方法及装置
本专利技术涉及通信领域,具体而言,涉及一种测序深度的矫正方法及装置。
技术介绍
一些研究表明,通过扩增和测序引入的GC偏差对染色体非整倍性的敏感性产生了限制作用。在不同测序条件下,例如试剂成分不同、测序温度不同或者簇密度不同,GC偏差可能在样品制备和测序过程中引入,这会导致GC含量过高或GC含量过低的基因组区域的测序数据出现偏差。相关技术中开发了消除GC偏差的计算方法。HCFan和SRQuake开发了一种通过局部多项式回归拟合(LOESS回归)的计算方法消除GC偏差,该方法通过基于局部基因组GC含量对每个GC密度给予权重,以通过乘以相应权重矫正每个区域的Reads数目。但是,该方法在计算时可能造成数据轻微失真,会干扰检测的准确性。针对相关技术中,通过局部多项式回归拟合的计算方法来消除测序深度的偏差的方法,容易出现数据失真,结果准确性差等问题,尚未提出有效的技术方案。
技术实现思路
本专利技术实施例提供了一种测序深度的矫正方法及装置,以至少解决相关技术中通过局部多项式回归拟合的计算方法来消除测序深度的偏差的方法,容易出现数据失真,结果准确性差等问题。根据本专利技术本文档来自技高网...

【技术保护点】
1.一种测序深度的矫正装置,其特征在于,包括:获取模块,用于获取基因组上每个位点的GC含量,以及所述基因组的所有位点的测序深度;划分模块,用于根据每个位点的GC含量将所述所有位点按照指定规则分成N个不同区间,其中,N为正整数;第一确定模块,用于确定每个区间内所有位点的测序深度的第一泊松分布律,以及N个区间的平均测序深度的第二泊松分布律;转换模块,用于根据所述第一泊松分布律和所述第二泊松分布律对所有位点的测序深度的值进行转换,以使对于同一测序深度值,所述第一泊松分布律与所述第二泊松分布律相同;第二确定模块,用于将转换后的所有位点的测序深度作为矫正后的测序深度。

【技术特征摘要】
1.一种测序深度的矫正装置,其特征在于,包括:获取模块,用于获取基因组上每个位点的GC含量,以及所述基因组的所有位点的测序深度;划分模块,用于根据每个位点的GC含量将所述所有位点按照指定规则分成N个不同区间,其中,N为正整数;第一确定模块,用于确定每个区间内所有位点的测序深度的第一泊松分布律,以及N个区间的平均测序深度的第二泊松分布律;转换模块,用于根据所述第一泊松分布律和所述第二泊松分布律对所有位点的测序深度的值进行转换,以使对于同一测序深度值,所述第一泊松分布律与所述第二泊松分布律相同;第二确定模块,用于将转换后的所有位点的测序深度作为矫正后的测序深度。2.根据权利要求1所述的装置,其特征在于,所述划分模块,用于将GC含量落在第一范围内的位点化分在N个不同区间的两端区间内;以及将GC含量落在第二范围内的位点化分在中间区间内,其中,中间区间为所述N个不同区间中,除所述两端区间的其他区间,所述第一范围内的位点数目小于所述第二范围内的位点数目。3.根据权利要求1所述的装置,其特征在于,所述第一确定模块,还用于通过以下方式确定所述N个区间的平均测序深度:将所述基因组内所有位点的总深度除以所述基因组内位点的个数,得到所述N个区间的平均测序深度。4.根据权利要求1所述的装置,其特征在于,所述第一确定模块,还用于确定所述第二泊松分布律:p(x=n|λall)=eλλalln/n!,其中,λall为所述N个区间的平均测序深度。5.根据权利要求1所述的装置,其特征在于,所述装置还包括:矫正模块,用于根据矫正后的每个位点的测序深度和所述每个位点的GC含量矫正所述每个位点的GC偏好。6....

【专利技术属性】
技术研发人员:柴景超张静波伍启熹王建伟刘倩刘珂弟唐宇
申请(专利权)人:北京优迅医学检验实验室有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1