一种基于靶向高通量测序序列的比对方法及其应用技术

技术编号:39262966 阅读:25 留言:0更新日期:2023-10-30 12:15
本发明专利技术公开了一种基于靶向高通量测序序列的比对方法及其应用,该方法包括:构建物种序列数据库,获取带有引物的测序序列,去除测序序列的测序接头,定位引物在测序序列中的位置,将测序序列分类后提取潜在扩增目标序列的测序序列,将潜在扩增目标序列的测序序列比对到物种序列数据库中,确定测序序列的物种来源,将未比对到物种数据库的测序序列进一步比对到人源基因组中,最终将分析结果汇总。对比对区域的序列覆盖度、比对结果的期望值和比对区域的错配碱基数目进行阈值限定,同时满足三种阈值即得到测序序列对应的物种来源。本发明专利技术为快速鉴定病原微生物、降低鉴定错误、辅助优化引物设计以及实验流程提供一种测序序列的比对方法。比对方法。比对方法。

【技术实现步骤摘要】
一种基于靶向高通量测序序列的比对方法及其应用


[0001]本专利技术属于生物
,涉及一种基于靶向高通量测序序列的比对方法及其应用。

技术介绍

[0002]高通量测序技术(High

throughput sequencing)又称下一代测序(Next Generation Sequencing,NGS),通过将靶向目标物种的特异性片段进行特异扩增,以富集特异基因组区域,并进行测序验证。与无偏测序(NGS)相比,靶向高通量测序在检测常见病原体时,敏感度和特异性更高,成本也较低。特别对于目标病原体丰度较低的样本有显著优势。
[0003]多重PCR(multiplex PCR),又称多重引物PCR或复合PCR,是靶向高通量测序的首要步骤,负责富集目标物种的特异序列,多重PCR以较高敏感度扩增目标序列。多重PCR通过在同一PCR反应体系里加上两对以上引物,同时扩增出多个核酸片段的PCR反应,能够在同一PCR反应管内同时检出多种病原微生物,节省时间、试剂,同时节约经费。
[0004]但是在多重PCR的实验过程中可能存在诸多干扰因素,如:宿主比例偏高时,引物可能非特异性地富集人源序列;试剂和生产环境中的微生物残留会造成常见污染菌非特异性扩增。同时,随着目标病原体数目的增加,所需引物也随之增多,会提高引物二聚体形成的概率。另外,病原体基因组的序列差异大,对引物的覆盖度要求较高,需要明确的数据判定引物对是否能特异地靶向目标扩增区域。因此,提供一种能够减少测序序列比对时间、评估引物的有效性和准确识别目标病原体的方法具有重要意义。

技术实现思路

[0005]为解决现有技术存在的将所有测序序列进行比对耗时较长的问题,同时提供一种能够评估引物的有效性,并准确识别目标病原体的方法,本专利技术提供了一种基于靶向高通量测序序列的比对方法及其应用,针对多重扩增文库的特点,以追踪扩增引物的走向为核心,回溯和展现引物和目标序列的结合模式,筛选到潜在扩增目标序列的测序序列,将其比对到物种序列数据库中从而鉴定到病原体,同时本专利技术提供的方法还能够辅助优化引物设计和实验流程。本专利技术为快速鉴定病原微生物、辅助优化引物设计以及实验流程提供一种测序序列比对方法。
[0006]为实现本专利技术的技术目的,一方面,本专利技术提供了一种基于靶向高通量测序序列的比对方法,包括:构建物种序列数据库,获取带有引物的测序序列,将测序序列分类后提取潜在扩增目标序列的测序序列分类,将潜在扩增目标序列的测序序列比对到物种序列数据库中,对比对结果进行筛选确定测序序列的物种来源,将得到的分析结果汇总;
[0007]进一步,本专利技术提供的一种基于靶向高通量测序序列的比对方法中,构建物种序列数据库包括:在公共数据库(NCBI Nucleotide database)下载物种基因组序列,通过Linux软件合并基因组序列,使用SeqKit、CD

HIT或其他同类软件除冗余序列,使用BLAST比对软件构建比对软件的索引文件,得到物种序列数据库。
[0008]进一步,本专利技术提供的一种基于靶向高通量测序序列的比对方法,获取带有引物的测序序列包括:针对多重PCR体系的核酸扩增产物构建测序文库,经测序平台上机测序得
到带有引物的测序序列。使用常用数据分析软件(BLAST、BBDuk等软件)提取引物池中测序序列,去除序列一致性为100%的测序序列(使用SeqKit、CD

HIT或其他同类软件),并记录代表序列所包含的序列总数及其序列子集。
[0009]进一步,本专利技术提供的一种基于靶向高通量测序序列的比对方法中,获取带有引物的测序序列后还需要使用质控软件(如Cutadpt、Trimmomatic等软件)去除测序接头,进一步去除冗余,得到带有引物序列并切掉了测序接头的测序序列。
[0010]进一步,本专利技术提供的一种基于靶向高通量测序序列的比对方法中,测序序列分类前需要使用blastn将引物池序列比对到带有引物序列并切掉了测序接头的测序序列集合中,比对结果记录了引物与测序序列的比对位置、错配数等比对信息。测序序列分类包括:根据上述引物比对位置信息,将将引物序列匹配的精准位置记为“p”,将非引物所在的位置记为“i”,然后将测序序列从左到右的“p”和“i”顺序相连,即可得到每一条序列的引物和非引物序列的连接关系,进而对样本中所有测序序列分类。
[0011]进一步,本专利技术提供的一种基于靶向高通量测序序列的比对方法中,通过测序序列分类得到测序序列的分类标识符、重复序列数目、长度、比对位置、最长插入片段长度;引物来源、长度、比对位置;比对区域长度、序列一致性、错配碱基数目、gap数目;比对结果的bit score值、期望值等详细信息。
[0012]进一步,本专利技术提供的一种基于靶向高通量测序序列的比对方法中,潜在扩增目标序列的测序序列为“p

i”与“i

p

i”结合方式的引物对生物序列的扩增产物。随后通过blastn将潜在扩增目标序列的测序序列比对到物种序列数据库中,对测序序列设置阈值筛选后得到目标测序序列的物种来源。
[0013]进一步,本专利技术提供的一种基于靶向高通量测序序列的比对方法中,阈值筛选包括:序列覆盖度和比对区域的错配碱基数目,满足上述阈值后得到目标测序序列的物种来源。对比对区域的序列覆盖度和比对区域的错配碱基数目的阈值设置不做具体限定,本领域技术人员可根据试验需要自行设定。
[0014]进一步,本专利技术提供的一种基于靶向高通量测序序列的比对方法中,将未比对到物种数据库的测序序列,进一步比对到人源基因组及非目标物种序列数据库中,查看非特异性扩增情况。
[0015]进一步,本专利技术提供的一种基于靶向高通量测序序列的比对方法中,结果汇总将上述步骤产生的分析结果进行汇总统计带有引物序列的测序序列占比、测序序列类别及其占比、测序序列类别的引物来源及其占比、目标物种的引物来源及其序列占比、非特异性扩增的引物来源及其占比以及形成引物二聚体的引物对来源及其占比,明确了各引物在多重PCR体系和测序过程的真实动向,便于把控试验细节、优化引物设计以及病原微生物的鉴定。
[0016]另一方面,本专利技术请求保护一种基于靶向高通量测序序列的比对方法在鉴定病原体微生物中的应用,所述鉴定病原体微生物是以非诊断治疗目的的。
[0017]另一方面,本专利技术请求保护一种基于靶向高通量测序序列的比对方法在把控试验细节、优化引物设计中的应用。
[0018]与现有技术相比,本专利技术提供的技术方案至少具备下述的有益效果或优点:
[0019]本专利技术提供的一种基于靶向高通量测序序列的比对方法,能够得到设计引物和物种序列的对应扩增关系,通过约束该对应关系可以降低病原物种鉴定错误的风险。在完成
目标物种鉴定的既有目标的同时,系统性追踪引物池的引物走向,详细汇总了靶标序列来源及其占比、引物来源及其占比、引物二聚体来源及其占比、非特异性扩增序列来源及本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于靶向高通量测序序列的比对方法,其特征在于,包括:构建物种序列数据库,获取带有引物的测序序列,将测序序列分类后提取潜在扩增目标序列的测序序列分类,将潜在扩增目标序列的测序序列比对到物种序列数据库中,同时对测序序列分类得到的信息进行筛选确定测序序列的物种来源,将得到的分析结果汇总;所述潜在扩增目标序列为引物

非引物连接或非引物

引物

非引物连接的测序序列。2.根据权利要求1所述的基于靶向高通量测序序列的比对方法,其特征在于,所述测序序列分类得到的信息包括:比对区域的长度、序列一致性、错配碱基数目、gap数目;所述测序序列分类得到的信息还包括:比对结果的bit score值、期望值。3.根据权利要求1所述的基于靶向高通量测序序列的比对方法,其特征在于,所述筛选包括:设置序列覆盖度阈值和比对区域的错配碱基数目的阈值;所述序列覆盖度阈值和所述比对区域的错配碱基数目的阈值均得到满足后筛选到所述测序序列的物种来源。4.根据根据权利要求1所述的基于靶向高通量测序序列的比对方法,其特征在于,所述将测序序列分类包括定位引物在测序序列中的位置,根据所述引物在测序序列中的位置将引物序列匹配的位置记为“p”,将非引物所在的位置记为“i”,然后将测序序列从左到右的“p”和“i”顺序相连,得到每一条序列的引物和非引物序列的连接关系,根据所述连接关系进行测序序列分类;所述定位引物在测序序列中的位置通过blastn实现。5.根据根据权利要求1所述的基于靶向高通量测...

【专利技术属性】
技术研发人员:夏涵官远林段美林牛毓龙魏康飞杨军波胡龙骆晨
申请(专利权)人:西咸新区予果微码生物科技有限公司予果智造科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1