基于神经网络的蛋白设计方法及系统技术方案

技术编号:40055563 阅读:37 留言:0更新日期:2024-01-16 21:52
本发明专利技术涉及蛋白质数据处理技术领域,提出了基于神经网络的蛋白设计方法及系统,包括:获取蛋白质分子的图数据及氨基酸序列;根据蛋白质分子的图数据及氨基酸序列获取相互作用强度,利用聚类算法获取由相互作用强度组成的样本数据集的聚类结果,根据聚类结果获取热稳定性递增序列;根据热稳定性递增序列获取热稳定连续指数,根据热稳定连续指数获取超高热稳定性聚类簇,根据超高热稳定性聚类簇获取氨基酸合成序列,根据氨基酸合成序列获取目标氨基酸序列;根据目标氨基酸序列获取模拟氨基酸序列,根据模拟氨基酸序列获取模拟生成的蛋白质分子。本发明专利技术在保留蛋白质的热稳定功能的基础上设计氨基酸序列,使得设计蛋白质更符合预期效果。

【技术实现步骤摘要】

本专利技术涉及蛋白质数据处理,具体涉及基于神经网络的蛋白设计方法及系统


技术介绍

1、蛋白质是一种重要的生物大分子,蛋白质承担并执行着身体的各项功能。传统的蛋白质设计工程一般是基于已有的蛋白进行修改,以期望能够达到人们需求的新特性。但是,并非所有蛋白质模板都能够找到,有些蛋白质模板甚至在自然进化中尚未出现,此时蛋白设计技术凸显的尤为重要。蛋白设计的过程需要遵循设计要求,设计过程中包括两个重要的环节,一是确定蛋白支链骨架,二是固定主链的氨基酸序列。

2、随着神经网络等机器学习方法发展,多数采用深度学习的方法学习蛋白质结构,为蛋白设计的发展提供新的方向。蛋白质的进化一般会产生特定功能的氨基酸序列,而针对氨基酸序列的设计问题在于如何在约束蛋白质可折叠的基础上同时保留其功能,传统的理性设计蛋白质分子需要进行庞大的计算,现有的计算能力几乎无法完成,因此结合机器学习的蛋白设计成为了主流。


技术实现思路

1、本专利技术提供基于神经网络的蛋白设计方法及系统,以解决如何在约束蛋白质可折叠的基础上同时保留其功能的问本文档来自技高网...

【技术保护点】

1.基于神经网络的蛋白设计方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述的基于神经网络的蛋白设计方法,其特征在于,所述根据每个蛋白质分子的图数据及氨基酸序列获取每个蛋白质分子的氨基酸序列中每个氨基酸的近邻氨基酸集合的方法为:

3.根据权利要求1所述的基于神经网络的蛋白设计方法,其特征在于,所述根据每个蛋白质分子的氨基酸序列中每个氨基酸的近邻氨基酸集合获取每个蛋白质分子的氨基酸序列中每个氨基酸的相互作用强度的方法为:

4.根据权利要求3所述的基于神经网络的蛋白设计方法,其特征在于,所述根据氨基酸序列中每个氨基酸的近邻氨基酸集合获取每个氨基...

【技术特征摘要】

1.基于神经网络的蛋白设计方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述的基于神经网络的蛋白设计方法,其特征在于,所述根据每个蛋白质分子的图数据及氨基酸序列获取每个蛋白质分子的氨基酸序列中每个氨基酸的近邻氨基酸集合的方法为:

3.根据权利要求1所述的基于神经网络的蛋白设计方法,其特征在于,所述根据每个蛋白质分子的氨基酸序列中每个氨基酸的近邻氨基酸集合获取每个蛋白质分子的氨基酸序列中每个氨基酸的相互作用强度的方法为:

4.根据权利要求3所述的基于神经网络的蛋白设计方法,其特征在于,所述根据氨基酸序列中每个氨基酸的近邻氨基酸集合获取每个氨基酸的结构稳定度的方法为:

5.根据权利要求1所述的基于神经网络的蛋白设计方法,其特征在于,所述利用聚类算法获取每个蛋白质分子的氨基酸序列中所有氨基酸的相互作用强度的聚类结果,根据所述聚类结果获取每个蛋白质分子的热稳定性递增序列的方法为:

6.根据权利要求1所述的基于神经...

【专利技术属性】
技术研发人员:王曙蒙常天安
申请(专利权)人:江苏正大天创生物工程有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1