【技术实现步骤摘要】
本专利技术属于基因信息数据处理领域,特别是涉及到一种DNA靶向测序覆盖度图形化评估方法。
技术介绍
高通量测序技术已十分成熟,测序所需的时间和费用都大大的降低,因此,应用该技术检测基因变异的研究数量也越来越多。然而高通量测序技术并不是完美的,由于其在测序前要通过PCR手段对待测片段进行扩增,因此增加了测序的错误。当拿到了原始的测序数据,对测序质量的评估就显得尤为重要。通常,得到测序数据,第一步就是做质量控制,在这一步有许多的软件可以使用,比如FastQC,它会从GC含量、序列长度分布等等方面给对测序数据进行评估。但是,这只是从总体层面来评估测序数据是否达到了支撑后续分析的要求。外显子组测序、基因芯片测序等只对基因的外显子进行捕获测序,每次测序会涉及许多基因。通常的质量评估软件只能在总体层面评估测序质量的好坏。当关注某些具体基因的测序质量评估、或评估基因芯片在各个基因上的捕获水平时,总体的测序质量评估就不能够准确地反映具体关注基因的测序质量。
技术实现思路
有鉴于此,本专利技术提出一种DNA靶向测序覆盖度图形化评估方法,不仅评估碱基含量等指标,还包括基因不同区域覆盖情 ...
【技术保护点】
一种DNA靶向测序覆盖度图形化评估方法,其特征在于,包括以下步骤:1)数据提取,用来提取包含在基因不同区域内各个位点的测序深度数据;2)数据合并,当遇到基因包含的碱基位点过多时,将相近的N个位点的测序深度数据合并为均值;3)图形展示,展示包含在基因列表中的基因不同区域内各个位点的测序覆盖情况。
【技术特征摘要】
1.一种DNA靶向测序覆盖度图形化评估方法,其特征在于,包括以下步骤:1)数据提取,用来提取包含在基因不同区域内各个位点的测序深度数据;2)数据合并,当遇到基因包含的碱基位点过多时,将相近的N个位点的测序深度数据合并为均值;3)图形展示,展示包含在基因列表中的基因不同区域内各个位点的测序覆盖情况。2.根据权利要求1所述的一种DNA靶向测序覆盖度图形化评估方法,其特征在于,所述步骤1)输入的信息为bed文件和测序深度数据文件depth文件,所述bed文件包含染色体号、基因起始位点、基因终止位点、基因名和基因区域注释,所述depth文件包含染色体号、染色体位点和测序深度。3.根据权利要求2所述...
【专利技术属性】
技术研发人员:薛成海,雷文婕,侯婷婷,
申请(专利权)人:万康源天津基因科技有限公司,
类型:发明
国别省市:天津;12
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。