【技术实现步骤摘要】
一种化学计量蛋白质组基础分析的计算方法
[0001]本专利技术属于生物
,涉及一种化学计量蛋白质组基础分析的计算方法。
技术介绍
[0002]近年来随着蛋白质组测序和基于基因组数据的翻译与注释的快速发展,研究蛋白质组的组成和功能已成为当前生物信息学研究的热点。蛋白质组研究能够全面快速地获得某一物种特定组织或器官在某一状态下的几乎所有蛋白质组序列信息,这些计量信息可以应用于同源蛋白质比较,预测蛋白质互作网络及其功能,从而从蛋白质水平解释生物适应环境及其进化机制。
[0003]此外化学计量蛋白质组学是一门新兴的交叉学科。通过计算生物体蛋白质不同元素含量和氨基酸的组成,从而从元素和分子水平阐释蛋白质的序列的结构与功能。但现有的研究水平无法将巨大的数据直关的反应出来,缺乏可视化应用,极大的限制了非生物信息专业以及计算机基础相对薄弱人群对其进行分析,最终制约了化学计量蛋白质组学领域的研究与应用,因此开发一种高通量化学计量蛋白质组基础分析的计算方法,并进行统计与可视化输出就显得十分重要。
技术实现思路
[0 ...
【技术保护点】
【技术特征摘要】
1.一种化学计量蛋白质组基础分析的计算方法,包括如下流程步骤:(1)将待测物种蛋白质或蛋白质组序列的fasta格式文件记为蛋白质组数据A,放入文件夹in,并新建文件夹out。对文件夹in中的蛋白质组数据进行元素含量分析,运行Perl脚本1命令(“perl coun4protein.pl in out”),得到out文件夹的元素、酸碱氨基酸含量数据B(output1.xls)文件和元素、酸碱氨基酸平均含量数据C(output2.xls)文件。(2)对元素、酸碱氨基酸平均含量数据C进行可视化展示,运行R脚本1命令(在UNIX/Linux/MacOSX系统运行:“Rscript protein
‑
环状图
‑
柱状图.R”;或在windows的R或Rstudio直接运行:“protein
‑
环状图
‑
柱状图.R”),得到平均含量可视化的环状图和柱状图。(3)对元素、酸碱氨基酸含量数据B进行可视化展示,运行R脚本2命令(在UNIX/Linux/MacOSX系统运行:“Rscript protein
‑
频率分布图.R”;或在windows的R或Rstudio直接运行:“protein
‑
频率分布图.R”),得到元素含量的频率分布图。(4)对元素、酸碱氨基酸含量数据B进行极端值基因数据筛选,运行R脚本3(在UNIX/Linux/MacOSX系统运行:“Rscript protein
‑
气泡图.R”;或在windows的R或Rstudio直接运行:“protein
‑
气泡图.R”),得到数据可视化
‑
气泡图,改图表示不同元素中,具有该元素含量最高和最低的10种蛋白图示。(5)对元素、酸碱氨基酸含量数据B进行极端值蛋白功能富集,运行R脚本4(在UNI...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。