【技术实现步骤摘要】
病毒整合位点捕获测序分析方法
本专利技术属于基因工程技术、生物信息
,尤其涉及一种病毒(HBV)整合位点捕获测序分析的方法。
技术介绍
肿瘤病毒主要分为DNA病毒和RNA病毒。DNA病毒引起癌变的作用机理在于,病毒感染细胞后通过早期基因编码的转化蛋白结合或者作用于细胞的抑癌蛋白P53或者Rb上,从而引起P53或者Rb失活,导致细胞无限增殖和生长失控,最终诱发细胞转化和肿瘤形成。而RNA病毒基因组携带有病毒癌基因,其通过病毒癌基因转录翻译产生的蛋白引起宿主细胞转化和致癌作用。某些既不含有病毒癌基因,也不优先插入和整合在细胞癌基因附近的RNA病毒,则通过自身基因组P40tax调节蛋白以反式激活细胞增殖的相关基因表达,从而引起细胞无限增殖和诱发癌症的发生。此外对于HBV、HPV等整合性的病毒,则通过病毒的部分序列整合到宿主基因组中,引起相关基因表达的上调或者下调以及染色体的不稳定性,从而使正常的细胞向无限增殖的肿瘤细胞转化,所以研究病毒与宿主之间的整合关系对于阐明与病毒相关的肿瘤的发生发展机制具有重要的科学意义。传统的研究方法主要有染色体步行PCR、q ...
【技术保护点】
【技术特征摘要】
1.一种病毒整合位点捕获测序分析方法,其特征在于,该方法包括: 参考序列构建步骤,将人的参考序列和病毒的参考序列合并在一起,构建一个混合参考序列; 数据过滤步骤,读取测序数据,过滤该测序数据中不合格的部分,得到过滤后的测序数据; 数据比对步骤,利用比对软件将处理后的测序数据比对到混合参考序列上,获取一个比对结果,然后对该比对结果进行处理,得到一个用于检测病毒整合的比对结果; 序列获取步骤,根据该用于检测病毒整合的比对结果,执行相应的操作,获取病毒整合的相关序列; 整合位点获取步骤,综合上述相关序列的比对信息,获取病毒整合位点在混合参考序列上的坐标;及 分析结果输出步骤,综合整合位点的坐标信息,得到并输出病毒整合结果。2.如权利要求1所述的病毒整合位点捕获测序分析方法,其特征在于,在整合位点获取步骤之后、分析结果输出步骤之前,还包括: 整合位点进阶分析步骤,根据病毒整合位点的坐标,寻找比对结果中支持整合的异常双末端测序序列对的数目,并统计整合位点处的深度、整合位点上下游预设范围的平均深度;及 所述分析结果输出步骤还包括,综合整合位点的坐标信息、异常双末端测序序列对的数目和深度信息对整合位点进行过滤,得到并输出乙肝病毒整合结果。3.如权利要求2所述的病毒整合位点捕获测序分析方法,其特征在于,所述异常双末端测序序列的寻找方法包括: 根据比对结果计算出平均插入片断长度和标偏差,则异常双末端测序序列满足以下条件一与条件二: 条件一,比对结果中记录的双末端测序序列的插入片断长度小于平均插入片断长度减去4倍标准差或者大于平均插入片断长度加上4倍标准差; 条件二,在上游染色体和下游染色体不同的条件下,整个片断的实际长度大于或等于平均插入片断长度减去4倍标准差并且小于或等于平均插入片断长度加上4倍标准差。4.如权利要求1或2所述的病毒整合位点捕获测序分析方法,其特征在于,所述数据过滤步骤包括: 去除含接头的测序序列、不明确碱基型的碱基N的比例大于预设值的测序序列、及质量低于预设要求的测序序列,所述预设要求为:质量值5的碱基数占整个测序序列的50%以上; 所述序列获取步骤包括: 序列获取步骤一,从比对结果中挑出截短比对上的测序序列,根据比对位置将相似度大于预设值的序列合并,然后利用比对软件,将被截掉的部分重新比对到混合参考序列上;及 序列获取步骤二,从比对结果中挑出两端都比对不上的双末端测序序列,将测通的双末端测序序列连成一条长序列,然后利用比对软件,将连接好的长序列比对回混合参考序列上。5.如权利要求4所述的病毒整合位点捕获测序分析方法,其特征在于,所述序列获取步骤一包括: 根据比对结果中的软截短reads比对上的部分的比对位置和reads被截短的方向,将软截短reads分成若干组,同一组内的软截短reads将...
【专利技术属性】
技术研发人员:丘坤龙,何铭辉,
申请(专利权)人:深圳华大基因科技服务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。