当前位置: 首页 > 专利查询>北京大学专利>正文

基于深度学习的16S rRNA基因测序引物设计方法及系统技术方案

技术编号:41096027 阅读:18 留言:0更新日期:2024-04-25 13:54
本发明专利技术提供一种基于深度学习的16S rRNA基因测序引物设计方法及系统,涉及引物设计技术领域。首先获取目标细菌群落相关的属列表,基于属列表得到代表性16S rRNA基因全长序列,利用预先训练的区域划分模型预测代表性全长序列的各个可变区域及保守区域,确定符合测序平台要求的候选扩增区域用于引物设计,针对每个候选扩增区域确定对应的正向引物结合区序列集和反向引物结合区序列集,基于两种序列集分别进行多序列比对得到候选特异性引物对,最后筛选得到目标细菌群落特异性引物对。本发明专利技术无需进行16S rRNA基因全长序列多序列比对,直接基于区域划分模型划分确定出候选扩增区域进行多序列比对,可有效节省运算时间和使用内存,提高引物设计流程的整体效率。

【技术实现步骤摘要】

本专利技术实施例涉及引物设计,尤其涉及一种基于深度学习的16srrna基因测序引物设计方法及系统。


技术介绍

1、16s rrna基因的高通量测序通常使用通用引物来结合目标可变区域(v-region)两侧的保守位点,该方法已被广泛用于揭示各种环境下细菌群落的复杂组成。然而,由于所谓的保守区域并非在所有类群中都是普遍保守的,导致通用引物可能无法有效扩增某些细菌的16s rrna基因,进而导致特定类群的存在会被低估,甚至被完全排除在外。此外,若选择的目标可变区域的分类准确性不足,一些扩增片段可能会被错误分类,从而也会导致对某些类群丰度的错误估计。因此,如果不加考虑地直接运用所谓的通用引物对目标细菌群落进行扩增,由于通用引物的引物扩增偏差,可能会引发对后续细菌组成分析的偏误(这一问题在生物量较低的样本中尤为突出)。不仅如此,由于通用引物的设计通常侧重于易培养和常见的物种,导致通用引物在检测一些稀有细菌时往往表现出较低的灵敏度,在使用通用引物时,某些稀有细菌的存在往往被低估甚至忽略,导致稀有物种丰度被错误估计。因此,需要针对性地对特定菌群进行16s测序引物设计。<本文档来自技高网...

【技术保护点】

1.一种基于深度学习的16S rRNA基因测序引物设计方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于深度学习的16S rRNA基因测序引物设计方法,其特征在于,所述方法还包括:

3.根据权利要求1所述的基于深度学习的16S rRNA基因测序引物设计方法,其特征在于,针对每个候选扩增区域:对正向引物结合区序列集和反向引物结合区序列集分别进行多序列比对,生成每个候选扩增区域对应的候选特异性引物对,包括:

4.根据权利要求3所述的基于深度学习的16S rRNA基因测序引物设计方法,其特征在于,分别从正向引物结合区序列集和反向引物结合区序列集中...

【技术特征摘要】

1.一种基于深度学习的16s rrna基因测序引物设计方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于深度学习的16s rrna基因测序引物设计方法,其特征在于,所述方法还包括:

3.根据权利要求1所述的基于深度学习的16s rrna基因测序引物设计方法,其特征在于,针对每个候选扩增区域:对正向引物结合区序列集和反向引物结合区序列集分别进行多序列比对,生成每个候选扩增区域对应的候选特异性引物对,包括:

4.根据权利要求3所述的基于深度学习的16s rrna基因测序引物设计方法,其特征在于,分别从正向引物结合区序列集和反向引物结合区序列集中滑窗划分多个候选引物结合片段,基于每次滑窗得到的候选引物结合片段中包括的保守位点、退化保守位点和不保守位点,分别确定正向候选引物序列集和反向候选引物序列集,包括:

5.根据权利要求1所述的基于深度学习的16s rrna基因测序引物设计方法,其特征在...

【专利技术属性】
技术研发人员:朱怀球张灏宇江小青喻雄武王泓毅郭倩吴姝芳
申请(专利权)人:北京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1