当前位置: 首页 > 专利查询>湖南大学专利>正文

病毒基因组鉴定和拼接的方法及应用技术

技术编号:37509025 阅读:44 留言:0更新日期:2023-05-07 09:48
本发明专利技术提供了一种病毒基因组鉴定和拼接的方法及应用。该方法包括:对于原始数据进行前处理。将高质量reads拼接为初始重叠群。以初始重叠群作为查询序列,对待鉴定病毒的蛋白序列做同源性搜索,得到潜在病毒重叠群。以潜在病毒重叠群作为查询序列在NCBI NR库中进行同源性搜索,保留潜在病毒重叠群中的最佳比对属于病毒的查询重叠群,作为目标病毒重叠群,并得到与目标病毒重叠群对应的最佳比对的病毒物种。从参考病毒基因组序列库中选择最佳比对的病毒物种所对应的参考基因组,对高质量reads进行拼接,得到待鉴定病毒的病毒基因组序列。上述方法可以实现从原始测序数据出发一条龙地输出样本中包含的病毒及其基因组序列和丰度。和丰度。和丰度。

【技术实现步骤摘要】
病毒基因组鉴定和拼接的方法及应用


[0001]本专利技术涉及基因
,尤其涉及一种病毒基因组鉴定和拼接的方法及应用。

技术介绍

[0002]从宏转录组或宏基因组中鉴定出病毒序列,并进一步拼接成病毒基因组,这是病毒组研究的基础。下面分别介绍病毒鉴定和基因组拼接中几种代表性的方法。
[0003]1病毒基因序列的鉴定方法
[0004]病毒基因序列的鉴定方法分为两类:一类是基于同源性的方法,比如使用同源性搜索软件BLAST或HMM,该类方法的优点在于比较准确,其缺点在于很难鉴定远同源的病毒序列;另外一类是基于机器学习的方法,如Seeker或VirFinder,该类方法的优点在于可以鉴定任何病毒序列,其缺点在于假阳性率比较高。
[0005]2病毒基因组拼接方法
[0006]分为两类:一类是基于参考基因组的方法,如MetaCompass和VirGena,其优点在于拼接比较准确,缺点在于需要确定参考基因组,不适合病毒组的研究;另外一类是从头拼接的方法,如Trinity和Haploflow,该类方法的优点在于不需要参考基因组本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种病毒基因组鉴定和拼接的方法,其特征在于,包括:对于原始的宏转录组或宏基因组的测序数据进行前处理,去除所述测序数据中的低质量reads和接头,得到处理后的测序数据;所述处理后的测序数据包括高质量reads;将所述高质量reads拼接为初始重叠群;所述初始重叠群的长度大于所述高质量reads的长度;以所述初始重叠群作为查询序列,对待鉴定病毒的蛋白序列做同源性搜索,得到潜在病毒重叠群;以所述潜在病毒重叠群作为查询序列在NCBINR库中进行同源性搜索,保留所述潜在病毒重叠群中的最佳比对属于病毒的查询重叠群,作为目标病毒重叠群,并得到与所述目标病毒重叠群对应的最佳比对的病毒物种,根据比对情况确定所述待鉴定病毒的物种分类;从参考病毒基因组序列库中选择最佳比对的病毒物种所对应的参考基因组,并参照所述参考基因组作为引导序列对所述高质量reads进行拼接,得到所述待鉴定病毒的病毒基因组序列。2.根据权利要求1所述的方法,其特征在于,在所述去除所述测序数据中的低质量reads和接头的步骤中:采用fast...

【专利技术属性】
技术研发人员:彭友松傅萍
申请(专利权)人:湖南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1