【技术实现步骤摘要】
Kraken2软件输出结果的优化方法及鉴定样本中物种类型的方法
本专利技术涉及生物领域。具体地,本专利技术涉及Kraken2软件输出结果的优化方法及鉴定样本中物种类型的方法。
技术介绍
宏基因组是指特定环境下所有生物遗传物质的总和,以其作为研究对象,通过测序分析、功能基因筛选等方式可以获取样本中的生物组成及生物之间、生物和环境之间的关系。宏基因组测序简称mNGS,即metagenomicsnextgenerationsequencing,是一种对环境中所有生物基因组不加分离进行混合测序的技术。病原微生物,指能使人或动物致病的微生物。包括寄生虫、真菌、细菌病毒等。mNGS可以实现对样本中所有的微生物进行鉴定,并且可以鉴定新的物种,这是采用常规的实验方法如涂片、生化鉴定、培养鉴定及基于多重PCR的检测技术所无法实现的。mNGS因无需培养、不依赖探针序列、无偏好覆盖广等优点,在临床疑似病原体、罕见病原体、急危重症等临床感染病原检测应用较广。mNGS检测的是样本中所有生物的基因组。在检测前,样 ...
【技术保护点】
1.一种Kraken2软件输出结果的优化方法,其特征在于,包括:/n将测序结果中每个读段的子读段与已知数据库中的物种序列进行匹配,获取每个读段中匹配上每个物种的子读段的kmer数,选择每个读段中各kmer数中的最大值,记作kmermax数;/n将所述kmermax数与第一阈值进行比较,当所述kmermax数小于等于第一阈值时,去除所述kmermax数对应的读段,以便对所有读段进行过滤。/n
【技术特征摘要】
1.一种Kraken2软件输出结果的优化方法,其特征在于,包括:
将测序结果中每个读段的子读段与已知数据库中的物种序列进行匹配,获取每个读段中匹配上每个物种的子读段的kmer数,选择每个读段中各kmer数中的最大值,记作kmermax数;
将所述kmermax数与第一阈值进行比较,当所述kmermax数小于等于第一阈值时,去除所述kmermax数对应的读段,以便对所有读段进行过滤。
2.根据权利要求1所述的方法,其特征在于,所述第一阈值为15~30。
3.根据权利要求1所述的方法,其特征在于,进一步包括:
将所述过滤后剩余的读段作为候选读段,每个所述候选读段中kmermax数对应的物种作为候选物种;
针对每个所述候选物种,选择所述候选物种匹配上的所有读段的kmer数之和,记作kmersum数;
将所述kmersum数与第二阈值进行比较,当所述kmersum数小于第二阈值时,去除所述kmersum数对应的候选物种,以便对所述候选物种进行过滤,去除不符合要求...
【专利技术属性】
技术研发人员:王涛,肖姗姗,常壹昭,
申请(专利权)人:杭州瑞普基因科技有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。