一种病原物种特异性序列的筛选方法及系统技术方案

技术编号:36708350 阅读:32 留言:0更新日期:2023-03-01 09:32
本申请属于生信分析技术领域,具体涉及一种病原物种特异性序列的筛选方法及系统,本申请建立了一套便捷获取物种特异性序列的方法,可用于种/亚种/菌株型的特异性区域筛选,相较于传统方法,准确性高并且时间成本低,同时还能实现使用最少引物对即可覆盖最全目标物种。能实现使用最少引物对即可覆盖最全目标物种。能实现使用最少引物对即可覆盖最全目标物种。

【技术实现步骤摘要】
一种病原物种特异性序列的筛选方法及系统


[0001]本申请属于生物信息学
,具体涉及一种病原物种特异性序列的筛选方法及系统。
技术背景
[0002]病原感染仍然是威胁全世界人类健康的巨大问题,给临床诊断和治疗带来了沉重负担。临床对于病原微生物的主要检测方式为临床培养或生化检测,随着下一代测序技术的不断进步,宏基因组测序(mNGS)极大的提高了病原检测的效率,并有助于识别难以培养的病原微生物。然而,mNGS在临床应用方面仍面临诸多障碍,尤其是当检验样品总量少、样本微生物含量低时,如咽拭子样品、支气管肺泡灌洗液样品、血液样品和脑脊液样品等。同时,由于宿主细胞和核苷酸在这些样本中往往占比很大(通常>90%的宿主成分),极大地降低了微生物鉴定的测序效率。
[0003]基于PCR的检测方法以及由常规PCR衍生出来的多重PCR,由于其高灵敏度和低成本而被广泛用于诊断和监测应用。病原靶向测序(tNGS)通过超多重PCR扩增与高通量测序两种技术的结合,能够应对检测样本中存在的几十至上百种病原体。对低浓度的病原微生物的检测,由于通过了本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种病原物种特异性序列的筛选方法,其特征在于,包括如下步骤:1)病原比对数据库构建;基于公共数据库进行病原物种序列的筛选和过滤,构建病原比对数据库;优选的,所述数据库为公共数据库Refseq和/或GenBank数据库;2)目标物种基因组筛选;从病原比对数据库中筛选高质量目标物种的基因组序列;优选的,所述基因组序列选自完整基因组序列或染色体级别基因组序列;3)物种共有/保守区域筛选;对筛选出的基因组序列打断成序列片段,合并所有序列片段,并进行聚类;4)物种间特有序列筛选;基于聚类结果,从每个聚类cluster中随机挑选1条序列作为代表序列,将代表序列与病原比对数据库进行比对,得到初步比对结果;将序列相似度M高于阈值,并且该序列除比对到目标物种外未比对到其他物种的代表序列,作为该物种的特异性序列。2.根据权利要求1所述的方法,其特征在于,所述3)具体为:基于筛选出的基因组序列,将基因组序列打断为长度为L划窗为N的序列片段,将所有的序列片段合并,得到片段化后的基因组的fasta序列;聚类要求为同一个cluster内的序列的identity>95%;优选的,所述L和N的取值为50

100000bp。3.根据权利要求2所述的方法,其特征在于,所述3)进一步包括,选择性去除聚类cluster中包含的基因组数量远小于总基因组数量的cluster。4.根据权利要求1所述的方法,其特征在于,所述步骤4)中,所述相似度M计算如下:M=#$其中,A为一条序列正确比对上参考序列的碱基数,L为该序列的总长度;优选的,所述阈值为0.95。5.根据权利要求1<...

【专利技术属性】
技术研发人员:张全全邓望龙张佩佩任用李诗濛
申请(专利权)人:江苏先声医学诊断有限公司南京先声医学检验实验室有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1