【技术实现步骤摘要】
一种病原物种特异性序列的筛选方法及系统
[0001]本申请属于生物信息学
,具体涉及一种病原物种特异性序列的筛选方法及系统。
技术背景
[0002]病原感染仍然是威胁全世界人类健康的巨大问题,给临床诊断和治疗带来了沉重负担。临床对于病原微生物的主要检测方式为临床培养或生化检测,随着下一代测序技术的不断进步,宏基因组测序(mNGS)极大的提高了病原检测的效率,并有助于识别难以培养的病原微生物。然而,mNGS在临床应用方面仍面临诸多障碍,尤其是当检验样品总量少、样本微生物含量低时,如咽拭子样品、支气管肺泡灌洗液样品、血液样品和脑脊液样品等。同时,由于宿主细胞和核苷酸在这些样本中往往占比很大(通常>90%的宿主成分),极大地降低了微生物鉴定的测序效率。
[0003]基于PCR的检测方法以及由常规PCR衍生出来的多重PCR,由于其高灵敏度和低成本而被广泛用于诊断和监测应用。病原靶向测序(tNGS)通过超多重PCR扩增与高通量测序两种技术的结合,能够应对检测样本中存在的几十至上百种病原体。对低浓度的病原微生 ...
【技术保护点】
【技术特征摘要】
1.一种病原物种特异性序列的筛选方法,其特征在于,包括如下步骤:1)病原比对数据库构建;基于公共数据库进行病原物种序列的筛选和过滤,构建病原比对数据库;优选的,所述数据库为公共数据库Refseq和/或GenBank数据库;2)目标物种基因组筛选;从病原比对数据库中筛选高质量目标物种的基因组序列;优选的,所述基因组序列选自完整基因组序列或染色体级别基因组序列;3)物种共有/保守区域筛选;对筛选出的基因组序列打断成序列片段,合并所有序列片段,并进行聚类;4)物种间特有序列筛选;基于聚类结果,从每个聚类cluster中随机挑选1条序列作为代表序列,将代表序列与病原比对数据库进行比对,得到初步比对结果;将序列相似度M高于阈值,并且该序列除比对到目标物种外未比对到其他物种的代表序列,作为该物种的特异性序列。2.根据权利要求1所述的方法,其特征在于,所述3)具体为:基于筛选出的基因组序列,将基因组序列打断为长度为L划窗为N的序列片段,将所有的序列片段合并,得到片段化后的基因组的fasta序列;聚类要求为同一个cluster内的序列的identity>95%;优选的,所述L和N的取值为50
‑
100000bp。3.根据权利要求2所述的方法,其特征在于,所述3)进一步包括,选择性去除聚类cluster中包含的基因组数量远小于总基因组数量的cluster。4.根据权利要求1所述的方法,其特征在于,所述步骤4)中,所述相似度M计算如下:M=#$其中,A为一条序列正确比对上参考序列的碱基数,L为该序列的总长度;优选的,所述阈值为0.95。5.根据权利要求1<...
【专利技术属性】
技术研发人员:张全全,邓望龙,张佩佩,任用,李诗濛,
申请(专利权)人:江苏先声医学诊断有限公司南京先声医学检验实验室有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。