一种基于长读长测序数据的病原微生物分析方法技术

技术编号:33791874 阅读:38 留言:0更新日期:2022-06-12 14:48
本发明专利技术属于病原微生物检测技术领域,公开了一种基于长读长测序数据的病原微生物分析方法,具体包括:建立纠错参考序列库,将质控后的测序数据比对至纠错参考序列库校正,并在校正后合并相似度高的序列,再比对至病原微生物鉴定数据库得到微生物检出清单。本发明专利技术通过对测序数据的校正和合并,有效提高了数据分析速度,并有效降低了长度长测序数据结果的假阳性,实现病原微生物的快速、准确检出。准确检出。

【技术实现步骤摘要】
一种基于长读长测序数据的病原微生物分析方法


[0001]本专利技术属于病原微生物检测
,具体涉及一种基于长读长测序数据的病原微生物分析方法。

技术介绍

[0002]病原微生物又称病原体,是一类对人和动物具有致病性的微生物,包括病毒、细菌、立克次体、支原体、衣原体、螺旋体、真菌、放线菌等。这些病原微生物可引起感染、过敏、肿瘤、痴呆等疾病,也是危害食品安全的主要因素之一,对病原体的检测必须做到快速、准确。随着医学微生物学研究技术的不断发展,病原学诊断已不再局限于病原体水平,深入到分子水平、基因水平的检测手段不断出现并被应用于临床和实验室。随着科技的发展,不依赖于传统的微生物培养,能够快速、客观地检测出临床样本中的疑似致病微生物(包括细菌、真菌和病毒)的基因检测技术逐渐代替其它检测技术,成为临床检验科和基础实验室对病原体的主流检测技术。
[0003]对于病原微生物的检测,二代测序是目前的主流通用平台,二代测序数据的准确性高,测序通量大,但存在测序读长短与测序时间长的问题,一般测序读长只有150bp,测序时间在12h以上。相比于二代测序,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于长读长测序数据的病原微生物分析方法,其特征在于,包括以下步骤:S1、对病原微生物的参考基因组进行截取下载获得靶向区域的参考序列,按照相似度对参考序列进行聚类校正,得到纠错参考序列库;S2、将质控后的测序数据与纠错参考序列数据库进行比对,对比对到同一个参考序列的测序序列进行校正;S3、再将测序数据中的测序序列两两比较,合并相似的测序序列;S4、将步骤S3所得测序数据比对到病原微生物鉴定数据库,质控后得到病原微生物检出清单。2.根据权利要求1所述基于长读长测序数据的病原微生物分析方法,其特征在于,步骤S1所述参考序列在聚类后按照引物的匹配顺序进行方向的一致性调整。3.根据权利要求1所述基于长读长测序数据的病原微生物分析方法,其特征在于,步骤S2所述质控的方法为:过滤掉长度小于m或质量值低于n的测序序列,并去除比对到宿主参考基因组的测序序列;所述m的取值范围为100~600bp,所述n的取值范围为8~11。4.根据权利要求1所述基于长读长测序数据的病原微生物分析方法,其特征在于,步骤S2所述校正的方法具体为:先过滤掉错误率高于a或覆盖率低于b的测序序列,再以参考序列为基准,对测序序列中的碱基位点进行纠错;所述a的取值范围为5%~10%,所述b的取值范围为50%~95%。5.根据权利要求4所述基于长读长测序数据的病原微生物分析方法,其特征在于,所述纠错的过程为:统计测序序列中每个位点的碱基频率,并计...

【专利技术属性】
技术研发人员:毛升王颖龙志成方涛赵淑云
申请(专利权)人:武汉明德生物科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1