【技术实现步骤摘要】
一种病毒测序序列的自动化分析方法及系统
本专利技术涉及基因测序分析
,特别是涉及一种病毒测序序列的自动化分析方法及系统。
技术介绍
本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。在过去二十年里已经出现了多种对人类有大规模杀伤力的新种类病毒,如重症急性呼吸综合征SARS、甲型流感病毒H1N1、中东呼吸综合征MERS、埃博拉病毒等病毒,但是目前对于病毒鉴定的研究尚且不足。现有的病毒鉴定工具通常基于BLAST与基因组数据库或者蛋白质数据库比对来鉴定,但是随着病毒数据成倍甚至指数级的增长,这种方法的速度处理逐渐变慢,所以面对大量增长的病毒测序数据的数量,现有方法已不能满足病毒鉴定需求;另外,由于病毒测序数据量的快速增长,基于序列比对方法所用到的数据库的存储也要占用越来越多的硬盘空间。
技术实现思路
为了解决上述问题,本专利技术提出了一种病毒测序序列的自动化分析方法及系统,针对大量增长的病毒测序数据量以及硬盘空间被大量占用的问题,本专利技术引入深度学习构建鉴定模型,在实现 ...
【技术保护点】
1.一种病毒测序序列的自动化分析方法,其特征在于,包括:/n对病毒测序序列经质量控制和序列组装后得到病毒基因组长序列;/n对病毒基因组长序列进行编码后采用预先训练的深度学习网络模型进行类型鉴定;/n根据病毒基因组长序列与参考基因组的序列比对进行病毒测序序列的注释。/n
【技术特征摘要】
1.一种病毒测序序列的自动化分析方法,其特征在于,包括:
对病毒测序序列经质量控制和序列组装后得到病毒基因组长序列;
对病毒基因组长序列进行编码后采用预先训练的深度学习网络模型进行类型鉴定;
根据病毒基因组长序列与参考基因组的序列比对进行病毒测序序列的注释。
2.如权利要求1所述的一种病毒测序序列的自动化分析方法,其特征在于,所述质量控制为对病毒测序序列进行去接头和去引物序列的操作;
或者,所述序列组装为将短序列组装成长序列,以得到病毒基因组长序列;
或者,对病毒基因组长序列的碱基序列进行编码。
3.如权利要求1所述的一种病毒测序序列的自动化分析方法,其特征在于,对参考基因组进行特征工程后构建训练集,采用训练集对深度学习网络模型进行训练。
4.如权利要求1所述的一种病毒测序序列的自动化分析方法,其特征在于,所述类型鉴定包括:根据预先训练的深度学习网络模型对病毒测序序列进行识别,输出病毒测序序列属于每个族的概率,以概率最高的族为病毒测序序列的类型;
或者,所述深度学习网络模型包含多个平行分支网络,所述多个平行分支网络中至少存在一个分支网络的深度大于其他网分支络。
5.如权利要求1所述的一种病毒测序序列的自动化分析方法,其特征在于,所述病毒基因组长序列与参考基因组的序列比对中,根据相...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。