一种可用于大规模基因组的多基因组比对方法技术

技术编号:40466125 阅读:23 留言:0更新日期:2024-02-22 23:20
本方案公开了一种可用于大规模基因组的多基因组比对方法,属于计算机生物学技术领域,提出BWT‑FM‑LIS循环分治的方式检索全基因组间公共子串,尽可能多地检索出基因组间的公共子串和关键路径,缩短需动态规划对齐的差异子字符串长度,进而降低比对的复杂度以使本方案可用于大规模大基因组的比对,适用于大规模长序列或超长基因组数据,可以识别出基因组比对中多种结构变异。

【技术实现步骤摘要】

本方案属于计算机生物学,提出了一种可用于大规模基因组的多基因组比对方法


技术介绍

1、目前研究比较成熟的基因组序列比对工具主要为双序列比对,已被广泛地应用于基因组学研究。大多数工具采用的是“种子-扩展”方法,如blast,首先识别出序列间短且无插空的序列匹配(种子),然后使用smith-waterman改进算法从种子序列两端进行扩展匹配,直到对齐的分数低于指定阈值。种子类型可按照是否要求精确、连续匹配或匹配长度是否固定进行分类,blat和stellar采用k-mers作为其精确匹配种子,lastz(blastz的更新版本)使用间隔种子,last利用后缀数组可查找长度不等的自适应种子,mummer和chaos则分别使用后缀树和线程树数据结构快速查找所有具有一定最小长度的精确连续匹配种子。各类型种子中往往自适应、非精确或者间隔种子具有更高的灵敏度。扩展延伸之后,邻近且顺序、方向一致的局部对齐还可以被axtchain等链接程序链接起来,形成更大的对齐作为输出。

2、基因组的多序列比对工具开发相比于双序列比对较晚,巨大的时空复杂度也限制了多序列比对工本文档来自技高网...

【技术保护点】

1.一种可用于大规模基因组的多基因组比对方法,其特征在于,该方法包括:

2.根据权利要求1所述的可用于大规模基因组的多基因组比对方法,其特征在于,步骤S1中,

3.根据权利要求1所述的可用于大规模基因组的多基因组比对方法,其特征在于,步骤S4中,正向的公共子串检索方式为:

4.根据权利要求3所述的可用于大规模基因组的多基因组比对方法,其特征在于,被记录的所述公共子串信息根据检索结果为一对一模式或一对多模式;

5.根据权利要求1所述的可用于大规模基因组的多基因组比对方法,其特征在于,步骤S7中,采用Kband动态规划对差异子字符串对进行精细比...

【技术特征摘要】

1.一种可用于大规模基因组的多基因组比对方法,其特征在于,该方法包括:

2.根据权利要求1所述的可用于大规模基因组的多基因组比对方法,其特征在于,步骤s1中,

3.根据权利要求1所述的可用于大规模基因组的多基因组比对方法,其特征在于,步骤s4中,正向的公共子串检索方式为:

4.根据权利要求3所述的可用于大规模基因组的多基因组比对方法,其特征在于,被记录的所述公共子串信息根据检索结果为一对一模式或一对多模式;

5.根据权利要求1所述的可用于大规模基因组的多基因组比对方法,其特征在于,步骤s7中,采用kband动态规划对差异子字符串对进行精细比对:

6.根据权利要求5所述的可用于大规模基因组的多基因组...

【专利技术属性】
技术研发人员:邹权周通丁漪杰刘利
申请(专利权)人:电子科技大学长三角研究院衢州
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1