【技术实现步骤摘要】
本方案属于计算机生物学,提出了一种可用于大规模基因组的多基因组比对方法。
技术介绍
1、目前研究比较成熟的基因组序列比对工具主要为双序列比对,已被广泛地应用于基因组学研究。大多数工具采用的是“种子-扩展”方法,如blast,首先识别出序列间短且无插空的序列匹配(种子),然后使用smith-waterman改进算法从种子序列两端进行扩展匹配,直到对齐的分数低于指定阈值。种子类型可按照是否要求精确、连续匹配或匹配长度是否固定进行分类,blat和stellar采用k-mers作为其精确匹配种子,lastz(blastz的更新版本)使用间隔种子,last利用后缀数组可查找长度不等的自适应种子,mummer和chaos则分别使用后缀树和线程树数据结构快速查找所有具有一定最小长度的精确连续匹配种子。各类型种子中往往自适应、非精确或者间隔种子具有更高的灵敏度。扩展延伸之后,邻近且顺序、方向一致的局部对齐还可以被axtchain等链接程序链接起来,形成更大的对齐作为输出。
2、基因组的多序列比对工具开发相比于双序列比对较晚,巨大的时空复杂度
...【技术保护点】
1.一种可用于大规模基因组的多基因组比对方法,其特征在于,该方法包括:
2.根据权利要求1所述的可用于大规模基因组的多基因组比对方法,其特征在于,步骤S1中,
3.根据权利要求1所述的可用于大规模基因组的多基因组比对方法,其特征在于,步骤S4中,正向的公共子串检索方式为:
4.根据权利要求3所述的可用于大规模基因组的多基因组比对方法,其特征在于,被记录的所述公共子串信息根据检索结果为一对一模式或一对多模式;
5.根据权利要求1所述的可用于大规模基因组的多基因组比对方法,其特征在于,步骤S7中,采用Kband动态规划对差异
...【技术特征摘要】
1.一种可用于大规模基因组的多基因组比对方法,其特征在于,该方法包括:
2.根据权利要求1所述的可用于大规模基因组的多基因组比对方法,其特征在于,步骤s1中,
3.根据权利要求1所述的可用于大规模基因组的多基因组比对方法,其特征在于,步骤s4中,正向的公共子串检索方式为:
4.根据权利要求3所述的可用于大规模基因组的多基因组比对方法,其特征在于,被记录的所述公共子串信息根据检索结果为一对一模式或一对多模式;
5.根据权利要求1所述的可用于大规模基因组的多基因组比对方法,其特征在于,步骤s7中,采用kband动态规划对差异子字符串对进行精细比对:
6.根据权利要求5所述的可用于大规模基因组的多基因组...
【专利技术属性】
技术研发人员:邹权,周通,丁漪杰,刘利,
申请(专利权)人:电子科技大学长三角研究院衢州,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。