The invention discloses a system and a method for predicting effect of amino acid mutation on protein structure stability, the system is composed of amino acid variation information input module, calculation module, attribute of amino acid mutation protein sequence attribute calculation module, prediction module, change of stability prediction results output module; the method comprises the following steps of entry and access to information in advance of variation; about AAindex attributes and the calculation of physical and chemical properties of amino acid micro electrical characteristics; conserved protein sequence calculation and the corresponding amino acid mutation and protein properties; using two layers of three random forest algorithm to calculate the amino acid variation effect on protein stability; storage and output forecast results. According to the amino acid variation provided by the user and the corresponding protein sequence, the amino acid mutation can accurately predict the structural stability of the protein, decrease or remain unchanged, and the corresponding probability, and store the result and send the user to save it.
【技术实现步骤摘要】
预测氨基酸变异对蛋白质结构稳定性影响的系统及其方法
本专利技术属于生物医学数据分析
,具体涉及一种预测氨基酸变异对蛋白质结构稳定性影响的系统及其方法。
技术介绍
预测氨基酸变异对蛋白质稳定性影响的重要指标是野生型蛋白质和变异后蛋白质的自由能变化值ddG。目前已有的预测方法分为两种:一种是直接基于能量用物理公式计算,但由于蛋白质物理结构的不明确,这样计算结果并不准确,且泛化性弱;另一种是基于已有实验数据,运用机器学习的方法来预测,但这种方法会存在以下这些问题:(1)准确性差,目前通用的实验数据库Protherm中的数据错、漏较多,导致训练数据集质量差,严重影响预测结果的准确性;(2)泛化性差,该方法使用了大量蛋白质结构相关的输入属性,但对于蛋白质结构未知的情况,则无法预测。(3)实用性差,该方法缺乏一个支持单个和批量输入,并能将预测结果分为三类(变异导致蛋白质稳定性升高、降低、不变)的系统。
技术实现思路
为了解决上述问题,本专利技术旨在提供一种预测氨基酸变异对蛋白质结构稳定性影响的系统及其方法,该系统及其方法可以依据用户提供的氨基酸变异和对应的蛋白质序列,准确预测该氨基酸变异会导致所在蛋白质的结构稳定性升高、降低或不变,以及相应概率,并将结果存储并发送用户保存。为实现上述技术目的,达到上述技术效果,本专利技术通过以下技术方案实现:一种预测氨基酸变异对蛋白质结构稳定性影响的系统,由氨基酸变异信息输入模块、氨基酸变异位点属性计算模块、蛋白质序列属性计算模块、预测稳定性变化模块、预测结果输出模块组成,其中,所述氨基酸变异信息输入模块分别与所述氨基酸变异位点属性 ...
【技术保护点】
一种预测氨基酸变异对蛋白质结构稳定性影响的系统,其特征在于:由氨基酸变异信息输入模块(1)、氨基酸变异位点属性计算模块(2)、蛋白质序列属性计算模块(3)、预测稳定性变化模块(4)、预测结果输出模块(5)组成,其中,所述氨基酸变异信息输入模块(1)分别与所述氨基酸变异位点属性计算模块(2)和所述蛋白质序列属性计算模块(3)连接,所述氨基酸变异位点属性计算模块(2)和所述蛋白质序列属性计算模块(3)同时与所述预测稳定性变化模块(4)连接,所述预测稳定性变化模块(4)与所述预测结果输出模块(5)连接;所述氨基酸变异信息输入模块(1)的功能为获取用户提交的单个或成组的氨基酸变异及其蛋白质序列,并进行用户信息及数据的存储;所述氨基酸变异位点属性计算模块(2)的功能为根据野生型和变异型位点上的氨基酸情况,提取相对应的AAindex属性特征值,并根据氨基酸变异数据,计算变异后的氨基酸位点物理化学属性特征;所述蛋白质序列属性计算模块(3)的功能为根据氨基酸变异数据计算相关蛋白质的保守性以及蛋白质属性特征;所述预测稳定性变化模块(4)的功能为通过基于随机森林的两层三分类算法将氨基酸变异对蛋白质稳定性的 ...
【技术特征摘要】
1.一种预测氨基酸变异对蛋白质结构稳定性影响的系统,其特征在于:由氨基酸变异信息输入模块(1)、氨基酸变异位点属性计算模块(2)、蛋白质序列属性计算模块(3)、预测稳定性变化模块(4)、预测结果输出模块(5)组成,其中,所述氨基酸变异信息输入模块(1)分别与所述氨基酸变异位点属性计算模块(2)和所述蛋白质序列属性计算模块(3)连接,所述氨基酸变异位点属性计算模块(2)和所述蛋白质序列属性计算模块(3)同时与所述预测稳定性变化模块(4)连接,所述预测稳定性变化模块(4)与所述预测结果输出模块(5)连接;所述氨基酸变异信息输入模块(1)的功能为获取用户提交的单个或成组的氨基酸变异及其蛋白质序列,并进行用户信息及数据的存储;所述氨基酸变异位点属性计算模块(2)的功能为根据野生型和变异型位点上的氨基酸情况,提取相对应的AAindex属性特征值,并根据氨基酸变异数据,计算变异后的氨基酸位点物理化学属性特征;所述蛋白质序列属性计算模块(3)的功能为根据氨基酸变异数据计算相关蛋白质的保守性以及蛋白质属性特征;所述预测稳定性变化模块(4)的功能为通过基于随机森林的两层三分类算法将氨基酸变异对蛋白质稳定性的影响进行计算和分类,并给出相应概率,作为预测结果;所述预测结果输出模块(5)的功能为将预测结果生成excel和pdf文件形式,存储并自动邮件发送用户,同时支持用户查询统计。2.一种利用如权利要求1所述的系统的预测氨基酸变异对蛋白质结构稳定性影响的方法,其特征在于,包括以下步骤:步骤1)所述氨基酸变异信息输入模块(1)首先根据用户输入的氨基酸变异信息,获取其中的氨基酸变异及其蛋白质序列,然后所述氨基酸变异信息输入模块(1)将获取到的氨基酸变异数据以及与氨基酸变异对应的蛋白质序列数据分别传输至所述氨基酸变异位点属性计算模块(2)和所述蛋白质序列属性计算模块(3),同时,所有输入数据以及提交数据的用户信息将被系统存储;步骤2)在收到所述氨基酸变异数据后,所述氨基酸变异位点属性计算模块(2)一方面从AAindex数据库中,根据野生型和变异型位点上的氨基酸情况,提取相对应的AAindex属性特征值,另一方面以该氨基酸变异位点为中心,计算相邻位点中各类氨基酸的分布情况,并换算成相应的氨基酸位点物理化学属性特征;然后,所述氨基酸变异位点属性计算模块(2)将提取到的所述AAindex属性特征值和计算出的所述氨基酸位点物理化学属性特征同时传输至所述预测稳定性变化模块(4);步骤3)在收到所述与氨基酸变异对应的蛋白质序列数据后,所述蛋白...
【专利技术属性】
技术研发人员:杨洋,朱斐,严文颖,钱福良,郁春江,
申请(专利权)人:苏州大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。