一种基于高通量测序的物种鉴定系统和方法技术方案

技术编号:25311692 阅读:164 留言:0更新日期:2020-08-18 22:29
本发明专利技术“一种基于高通量测序的物种鉴定系统和方法”,涉及物种鉴定技术,包含可远程访问的服务器;所述服务器包含数据预处理模块和物种鉴定模块;所述数据预处理模块用于根据用户数据分析启动指令调取核酸序列数据处理工具对用户提供的高通量测序数据进行预处理得到经预处理数据;所述物种鉴定模块基于经预处理数据进行数据比对分析得出物种鉴定结果。

【技术实现步骤摘要】
一种基于高通量测序的物种鉴定系统和方法
本专利技术涉及物种鉴定技术,特别是一种基于高通量测序的物种鉴定方法及系统。
技术介绍
随着全球贸易的飞速发展和国际交流日益增加,出入境检验检疫工作迎来了前所未有的挑战,目前口岸工作面临业务量大,人员不足,鉴定专家缺乏等诸多难题。如何在确保检验检疫质量的同时,又能缩短检验检疫周期,加快通关速度,成为一大难题,因此必须提供新的检疫鉴定技术。DNA条形码技术是利用一段或者几段标准的、易扩增的、种间差异大于种内差异的DNA片段来进行物种鉴定的新技术,最早由加拿大学者Hebert提出。与传统的分类鉴定技术相比,DNA条形码技术具有操作简单,不受个体发育阶段和形态特征的限制等优点,使不具备物种分类鉴定知识的人也可以通过该技术对物种进行鉴定。该技术一经提出便迅速成为分子分类学及分子鉴定技术的核心方法,在生物物种鉴定方面发挥了重要作用。但传统的DNA条形码技术通常一次只能鉴定出一种或者少数几种物种,不能一次性快速分析出数百万基因序列、鉴定上千种物种。而多数情况下,待测样品通常是多种不同物种的混合物,特别是病原微生本文档来自技高网...

【技术保护点】
1.一种基于高通量测序的物种鉴定系统,其特征在于,包含可远程访问的服务器;/n所述服务器包含数据预处理模块和物种鉴定模块;/n所述数据预处理模块用于根据用户数据分析启动指令调取核酸序列数据处理工具对用户提供的高通量测序数据进行预处理得到经预处理数据,测序数据包括PCR扩增子测序数据和/或siRNA测序数据;/n对于来自PCR扩增子的测序数据的预处理,包括/n去接头、剔除低质量序列、嵌合体序列和过短序列,获得用于后续分析的有效序列的集合;以及对所述有效序列的集合进行归类操作即OTU聚类分析得到所述经预处理数据,包含代表样品中所含物种的代表性测序序列;/n对于来自siRNA的测序数据的预处理,包括...

【技术特征摘要】
1.一种基于高通量测序的物种鉴定系统,其特征在于,包含可远程访问的服务器;
所述服务器包含数据预处理模块和物种鉴定模块;
所述数据预处理模块用于根据用户数据分析启动指令调取核酸序列数据处理工具对用户提供的高通量测序数据进行预处理得到经预处理数据,测序数据包括PCR扩增子测序数据和/或siRNA测序数据;
对于来自PCR扩增子的测序数据的预处理,包括
去接头、剔除低质量序列、嵌合体序列和过短序列,获得用于后续分析的有效序列的集合;以及对所述有效序列的集合进行归类操作即OTU聚类分析得到所述经预处理数据,包含代表样品中所含物种的代表性测序序列;
对于来自siRNA的测序数据的预处理,包括对所述siRNA测序数据进行组装得到病毒重叠群和类病毒基因组群,得到所述经预处理数据,包含样品所含病毒类病毒种类的代表性测序数据;
对经预处理数据进行物种鉴定:将全部所述经预处理数据与物种鉴定模块中的真核生物鉴定单元、原核生物鉴定单元、病毒类病毒鉴定单元进行匹配,并在不同鉴定单元中将匹配到该单元的若干代表性测序序列与本地存储或在线关联的已知物种参考序列数据库同时进行BLAST比对,得出物种鉴定结果,并生成用户可下载的物种鉴定报告。


2.根据权利要求1所述的物种鉴定系统,其特征在于:
真核生物鉴定单元关联且可以调取以进行BLAST比对的已知物种参考序列数据库包含BOLD、NT;
原核生物鉴定单元关联且可以调取以进行BLAST比对的已知物种参考序列数据库包括BOLD、NT、UNITE、RDP、Sliva或GreenGene;
病毒类病毒鉴定单元关联且可以调取以进行BLAST比对的已知物种参考序列数据库包括NT、NR。


3.根据权利要求1所述的物种鉴定系统,其特征在于:所述核酸序列数据处理工具包括无关数据过滤软件;
用于过滤接头的CutAdapt软件;
用于OTU聚类分析的CD-hit,Uclust、BLAST、mothur、usearch或prefix/suffix;用于进行病毒类病毒序列组装的软件。


4.根据权利要求1所述的物种鉴定系统,其特征在于:
所述物种鉴定模块被配置为:
对于来自PCR扩增子的数据,当经预处理数据中某一序列与物种鉴定数据库中的一个已知参考序列相似性达到预定值,优选设定为97%,判定待检验检疫物品中含有该已知参考序列代表的物种。
对于siRNA测序数据,将经预处理数据中的病毒重叠群(contig)与NR库进行进行blastn比对,如果blastn相似性大于90%且覆盖度大于85%,则继续进行blastx,如果blastx相似性与blastn的相似度差异在10%以内为相似度高,判断为已知病毒;否则判断为新病毒,并通过与相似序列进行家族性进化树构建,识别新病毒;
将经预处理数据中的类病毒基因组群与NR库进行blastn比对,如果相似性大于90%,则判断为已知类病毒;否则继判断是否存在保守区域,如不存在则判断为未知病毒,如存在,则判断为新类病毒,并通过与相似序列家族性进化树构建,识别新类病毒。


5.根据权利要求1-4任一所述的物种鉴定系统,其特征在于:
还包含...

【专利技术属性】
技术研发人员:姜帆朱水芳张永江
申请(专利权)人:中国检验检疫科学研究院
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1