【技术实现步骤摘要】
一种化学计量基因组基础分析的计算方法
[0001]本专利技术属于生物
,涉及一种化学计量基因组基础分析的计算方法。
技术介绍
[0002]近年来,随着科学技术的发展,基因测序方法逐渐优化,基因组学领域的研究工作不断细化和发展, 基因组数据不断积累,促使该领域发展壮大。基于基因组学数据,通过计算基因或基因组中元素的使用偏 好性,不仅可以掌握元素使用偏好性的进化规律,还可以此作为评估资源限制对基因组的直接影响。如果 环境中某元素(如氮、磷等)不够,自然选择可能会促使生物减少使用这些限制性元素,进而影响基因的合 成,并限制生物的生长和繁殖。化学计量基因组的计算方法,指通过计算生物学的方法,计算基因组或 DNA序列的化学计量特征,包括元素(碳、氢、氧、氮)和单体(核苷酸)的组成和含量。化学计量基 因组学是一门新兴的交叉学科,包括了化学计量学、生态学、进化生物学、基因组学和生物信息学等内容, 为分子进化和生态系统的相互作用的研究提供理论基础,也为后基因组时代数据的挖掘提供了一个全兴的 视角。目前化学计量基因组的计算方法涉及复杂的 ...
【技术保护点】
【技术特征摘要】
1.一种化学计量基因组基础分析的计算方法,包括如下流程步骤:(1)将待测物种基因或基因组序列的fasta或fastq格式文件记为基因组数据A,放入文件夹in,并新建文件夹out。对文件夹in中的基因组数据进行碱基和元素含量分析,运行Perl脚本1命令(“perl coun4DNA.pl in out”),得到out文件夹的碱基和元素的含量数据B(output1.xls)文件和碱基和元素的平均含量数据C(output2.xls)文件。(2)对碱基和元素的平均含量数据C进行可视化展示,运行R脚本1命令(在UNIX/Linux/MacOSX系统运行:“Rscript genomics
‑
环状图
‑
柱状图.R”;或在windows的R或Rstudio直接运行:“genomics
‑
环状图
‑
柱状图.R”),得到碱基和元素平均含量的环状图和柱状图。(3)对碱基和元素的含量数据B进行可视化展示,运行R脚本2命令(在UNIX/Linux/MacOSX系统运行:“Rscript genomics
‑
频率分布图.R”;或在windows的R或Rstudio直接运行:“genomics
‑
频率分布图.R”),得到元素含量的频率分布图。(4)对碱基和元素的含量数据B进行极端值基因数据筛选,运行R脚本3(在UNIX/Linux/MacOSX系统运行:“Rscript genomics
‑
气泡图.R”;或在windows的R或Rstudio直接运行:“genomics
‑
气泡图.R”),得到不同元素中,具有该元素含量最高和最低的10种基因图示。(5)对碱基和元素的含量数据B进行极端值基因功能富集,运行R脚本4(在UNIX/Linux/MacOSX系统运行:...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。