一种批量计算基因组直系同源基因进化速率的方法技术

技术编号:13052003 阅读:458 留言:0更新日期:2016-03-23 16:39
本发明专利技术公开了一种批量计算基因组直系同源基因进化速率的方法。本发明专利技术所提供的计算基因组直系同源基因进化速率的方法综合运用了基于Blast成对比对结果后进行聚类搜索直系同源基因的InParanoid程序,基于多序列比对分析的MUSCLE程序,基于编码蛋白DNA序列之间的比较来评估同义和非同义替代比率的PAML软件包yn00程序,以及结合Perl脚本语言编程等方法。实验证明,本发明专利技术所提供的批量计算基因组直系同源基因进化速率的方法比较系统,检测基因组计算基因组直系同源基因进化速率各参数值的重复效果好,速度快,易实现批量化、自动化和流程化。

【技术实现步骤摘要】

本专利技术属于生物
,涉及一种批量计算基因组直系同源基因进化速率的方 法。
技术介绍
近年来,测序技术的蓬勃发展极大的促进了基因组学领域的研究工作。许多模式 生物如酵母菌、小鼠、人、拟南芥和水稻等全基因组测序的完成,使物种基因组遗传组分分 析的重要性日益突出,进而使分子进化学成为计算生物学和生物信息学等新兴学科的重要 组成部分,跻身生命科学中最引人注目的领域之一。进化速率的计算方法是该学科研究的 基础工具之一,对该学科的发展起了极大的推动作用。目前计算基因组的进化速率最常用 的方法是PAML软件包中的ynOO程序。然而,该程序利用最大似然法对DNA或蛋白质序列 进行系统发育分析时,程序背景知识涉及相当复杂的现代统计学理论和计算方法,对非专 业研究者来说是一种巨大挑战;此外,要保证ynOO程序的运行,需要把下载的基因组文件 进行诸多前处理,最后转化为具有固定格式的输入文件(如图2),这不仅增加了该模型的 使用耗时,还加大了批量计算基因组直系同源基因进化速率的难度,极大的限制了非生物 信息专业以及计算机基础相对薄弱人群对该软件的使用,最终制约了他们在分子进化领域 的研本文档来自技高网...
一种<a href="http://www.xjishu.com/zhuanli/55/CN105426700.html" title="一种批量计算基因组直系同源基因进化速率的方法原文来自X技术">批量计算基因组直系同源基因进化速率的方法</a>

【技术保护点】
一种批量计算基因组直系同源基因进化速率的方法,包括如下流程步骤:(1)将待测两物种Speci1和Speci2基因组蛋白序列fasta格式文件分别记为A和B数据集,所述A、B数据集的文件名分别为XXX1和XXX2,利用Linux系统中的InParanoid软件,运行“perl inparanoid.plXXX1XXX2”命令,得到“table.XXX1‑XXX2.fasta”文件;所述“table.XXX1‑XXX2.fasta”文件中的数据为Speci1和Speci2两物种间的直系同源基因对及分值,记为C数据集;所述“XXX1和XXX2”在运行InParanoid程序时已置于包含“inpara...

【技术特征摘要】

【专利技术属性】
技术研发人员:郭月刘静杜建厂
申请(专利权)人:江苏省农业科学院
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1