一种高通量分析多物种化学计量蛋白质组的方法技术

技术编号：37171958 阅读：13 留言：0更新日期：2023-04-20 22:42

本发明专利技术公开了一种高通量分析多物种化学计量蛋白质组的方法。本发明专利技术所提供的高通量分析多物种化学计量蛋白质组的方法综合运用了Perl脚本语言编程，R脚本语言编程和R语言可视化，基于多个物种蛋白质组数据，高通量计算多个物种蛋白质组特征值：元素(碳、氢、氧、氮、硫)与酸碱氨基酸的含量，通过计算每个蛋白质组中各元素平均含量以及可视化展示。实现了高通量分析化学计量蛋白质组的数据处理和图形可视化。实验证明，本发明专利技术所提供的高通量分析多物种化学计量蛋白质组的方法比较系统，效果好，速度快，易实现自动化和流程化。易实现自动化和流程化。易实现自动化和流程化。

全部详细技术资料下载

【技术实现步骤摘要】
一种高通量分析多物种化学计量蛋白质组的方法

[0001]本专利技术属于生物
，尤其是涉及一种高通量分析多物种化学计量蛋白质组的方法。

技术介绍

[0002]随着蛋白质测序与基因组翻译的不断完善，各种物种的蛋白质组数据不断积累与分析方法的改进及应用促进了蛋白质组学领域的研究工作不断细化和发展。其中化学计量蛋白质组学是当前的研究前沿，该学科研究不同蛋白质的元素使用偏好，计算蛋白质组及其序列的化学计量特征包括元素(碳、氢、氧、氮、硫)和酸性氨基酸与碱性氨基酸的组成和含量。并将计算的化学计量信息进行统计分析和可视化呈现。
[0003]然而现有的研究水平无法对蛋白质序列的化学计量信息进行高通量计算，并且缺乏可视化应用，极大的限制了非生物信息专业以及计算机基础相对薄弱人群对其进行分析，最终制约了生物化学组成领域的研究。因此迫切需要开发一种对海量的蛋白质组序列化学计量大数据计算方法。

技术实现思路

[0004]本专利技术的目的是提供一种高通量分析多物种化学计量蛋白质组的方法。
[0005]本专利技术所提供的高通量分析多物种化学计量蛋白质组的方法，具体可包括如下步骤：
[0006](1)将待测的第一个物种蛋白质组序列文件记为蛋白质组数据A(fasta格式)，第二个物种蛋白质组序列或多个物种蛋白质组文件记为蛋白质数据B(fasta格式)......将多个物种(≤8)的数据A、B、C等，放入文件夹in，并新建文件夹out。
[0007](2)对文件夹in中的蛋白质组数据进行蛋白质的元...

【技术保护点】

【技术特征摘要】
1.一种高通量分析多物种化学计量蛋白质组的方法，包括如下流程步骤：(1)将待测的第一个物种蛋白质组序列文件记为蛋白质数据A(fasta格式)，第二个物种蛋白质组序列或多个物种基因组文件记为蛋白质数据B(fasta格式)......将多个物种(≤8)的数据A、B、C等，放入文件夹in，并新建文件夹out。(2)对文件夹in中的蛋白质组数据进行元素含量分析，运行Perl脚本1命令“perl coun4protein.pl in out”，得到out文件夹中的元素、酸性氨基酸数据D(outputl.xls)和元素含量的比较分析数据E(output2.xls)文件。(3)将蛋白质组元素、酸性氨基酸数据D(进行可视化展示，运行R脚本1命令(在UNIX/Linux/MacOSX系统运行：“Rscript protein
‑
小提琴图.R”；或在windows的R或Rstudio直接运行：protein
‑
小提琴图.R)，得到像小提琴的元素、酸碱氨基酸分布图。(4)将蛋白质组元素含量的比较分析数据E进行可视化展示，...

【专利技术属性】
技术研发人员：张玉娟，仇鑫，
申请(专利权)人：重庆师范大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人