一种化学计量基因组基础分析的计算方法技术

技术编号:37236581 阅读:18 留言:0更新日期:2023-04-20 23:18
本发明专利技术公开了一种化学计量基因组进行基础分析的计算方法。本发明专利技术所提供的化学计量基因组进行基础分析的计算方法综合运用了Perl脚本语言编程,R脚本语言编程和R语言可视化,基于物种基因组数据,对物种的基因组进行元素的平均含量、碱基和元素的含量分布、极端基因的筛选和功能富集、元素含量与GC值的相关性的分析以及可视化展示。实验证明,本发明专利技术所提供的化学计量基因组进行基础分析的计算方法比较系统,效果好,速度快,易实现自动化和流程化。化。化。

【技术实现步骤摘要】
一种化学计量基因组基础分析的计算方法


[0001]本专利技术属于生物
,涉及一种化学计量基因组基础分析的计算方法。

技术介绍

[0002]近年来,随着科学技术的发展,基因测序方法逐渐优化,基因组学领域的研究工作不断细化和发展, 基因组数据不断积累,促使该领域发展壮大。基于基因组学数据,通过计算基因或基因组中元素的使用偏 好性,不仅可以掌握元素使用偏好性的进化规律,还可以此作为评估资源限制对基因组的直接影响。如果 环境中某元素(如氮、磷等)不够,自然选择可能会促使生物减少使用这些限制性元素,进而影响基因的合 成,并限制生物的生长和繁殖。化学计量基因组的计算方法,指通过计算生物学的方法,计算基因组或 DNA序列的化学计量特征,包括元素(碳、氢、氧、氮)和单体(核苷酸)的组成和含量。化学计量基 因组学是一门新兴的交叉学科,包括了化学计量学、生态学、进化生物学、基因组学和生物信息学等内容, 为分子进化和生态系统的相互作用的研究提供理论基础,也为后基因组时代数据的挖掘提供了一个全兴的 视角。目前化学计量基因组的计算方法涉及复杂的计算、统计学理论和分本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种化学计量基因组基础分析的计算方法,包括如下流程步骤:(1)将待测物种基因或基因组序列的fasta或fastq格式文件记为基因组数据A,放入文件夹in,并新建文件夹out。对文件夹in中的基因组数据进行碱基和元素含量分析,运行Perl脚本1命令(“perl coun4DNA.pl in out”),得到out文件夹的碱基和元素的含量数据B(output1.xls)文件和碱基和元素的平均含量数据C(output2.xls)文件。(2)对碱基和元素的平均含量数据C进行可视化展示,运行R脚本1命令(在UNIX/Linux/MacOSX系统运行:“Rscript genomics

环状图

柱状图.R”;或在windows的R或Rstudio直接运行:“genomics

环状图

柱状图.R”),得到碱基和元素平均含量的环状图和柱状图。(3)对碱基和元素的含量数据B进行可视化展示,运行R脚本2命令(在UNIX/Linux/MacOSX系统运行:“Rscript genomics

频率分布图.R”;或在windows的R或Rstudio直接运行:“genomics

频率分布图.R”),得到元素含量的频率分布图。(4)对碱基和元素的含量数据B进行极端值基因数据筛选,运行R脚本3(在UNIX/Linux/MacOSX系统运行:“Rscript genomics

气泡图.R”;或在windows的R或Rstudio直接运行:“genomics

气泡图.R”),得到不同元素中,具有该元素含量最高和最低的10种基因图示。(5)对碱基和元素的含量数据B进行极端值基因功能富集,运行R脚本4(在UNIX/Linux/MacOSX系统运行:...

【专利技术属性】
技术研发人员:张玉娟施韵朱梦黎
申请(专利权)人:重庆师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1