蛋白质结构模型构建方法、装置、存储介质和电子设备制造方法及图纸

技术编号:34545387 阅读:14 留言:0更新日期:2022-08-17 12:27
本申请提供一种蛋白质结构模型构建方法、装置、存储介质和电子设备,涉及计算机技术领域。本申请实施例提供的蛋白质结构模型构建方法可以基于待处理蛋白质的原始氨基酸序列对应的候选结构模板,构建待处理蛋白质的初始结构模型,针对原始氨基酸序列内的各第一氨基酸对,分别确定各第一氨基酸对中的两个氨基酸之间的实际距离,再基于各第一氨基酸对中的两个氨基酸之间的实际距离,对初始结构模型进行调整,得到待处理蛋白质的目标结构模型。与相关技术相比,可以提高蛋白质结构的精度,以获得更高精度的蛋白质结构。更高精度的蛋白质结构。更高精度的蛋白质结构。

【技术实现步骤摘要】
蛋白质结构模型构建方法、装置、存储介质和电子设备


[0001]本申请实施例涉及计算机
,尤其涉及一种蛋白质结构模型构建方法、装置、存储介质和电子设备。

技术介绍

[0002]蛋白质结构的预测和优化在医疗健康和生物工程方面都有一定的应用价值,例如,在新药研发中不仅需要了解蛋白质结构信息,还需要持续对蛋白质结构进行优化,酶工程也需要根据蛋白质结构来设计催化活性中心,等等。
[0003]目前可以通过实验方法,例如,X射线结晶、核磁共振以及冷冻电镜等方法来确定蛋白质结构,但是这种方法需要耗费大量时间和高昂的成本,并且经过预测和优化后得到的蛋白质结构的精度不高。

技术实现思路

[0004]为解决相关技术中存在的技术问题,本申请实施例提供一种蛋白质结构模型构建方法、装置、存储介质和电子设备,可以提高蛋白质结构的精度。
[0005]为达到上述目的,本申请实施例的技术方案是这样实现的:
[0006]第一方面,本申请实施例提供了一种蛋白质结构模型构建方法,所述方法包括:
[0007]基于待处理蛋白质的原始氨基酸序列对应的候选结构模板,构建所述待处理蛋白质的初始结构模型;
[0008]针对所述原始氨基酸序列内的各第一氨基酸对,分别确定所述各第一氨基酸对中的两个氨基酸之间的实际距离;
[0009]基于所述各第一氨基酸对中的两个氨基酸之间的实际距离,对所述初始结构模型进行调整,得到所述待处理蛋白质的目标结构模型。
[0010]在一种可选的实施例中,所述基于待处理蛋白质的原始氨基酸序列对应的候选结构模板,构建所述待处理蛋白质的初始结构模型之前,还包括:
[0011]基于预设的氨基酸序列与结构模板之间的对应关系,在蛋白质结构数据库中,查找与所述原始氨基酸序列相匹配的候选氨基酸序列;
[0012]将所述候选氨基酸序列对应的结构模板,作为所述原始氨基酸序列对应的候选结构模板。
[0013]在一种可选的实施例中,所述基于预设的氨基酸序列与结构模板之间的对应关系,在蛋白质结构数据库中,查找与所述原始氨基酸序列相匹配的候选氨基酸序列,包括:
[0014]将所述蛋白质结构数据库中的各氨基酸序列与所述原始氨基酸序列进行序列联配,确定所述各氨基酸序列与所述原始氨基酸序列的相似度;
[0015]将相似度最大的氨基酸序列作为与所述原始氨基酸序列相匹配的候选氨基酸序列。
[0016]在一种可选的实施例中,所述针对所述原始氨基酸序列内的各第一氨基酸对,分
别确定所述各第一氨基酸对中的两个氨基酸之间的实际距离,包括:
[0017]确定与所述原始氨基酸序列的相似度满足设定阈值的至少一个参考氨基酸序列;
[0018]根据各个所述参考氨基酸序列的结构特征生成特征矩阵;
[0019]将所述特征矩阵输入距离预测网络,基于所述距离预测网络确定所述各第一氨基酸对中的两个氨基酸之间的实际距离。
[0020]在一种可选的实施例中,所述基于所述各第一氨基酸对中的两个氨基酸之间的实际距离,对所述初始结构模型进行调整,得到所述待处理蛋白质的目标结构模型,包括:
[0021]采用循环迭代方式执行如下操作,直至所述初始结构模型的分子能量满足预设的循环迭代条件为止,根据最终一轮输出的初始结构模型,确定所述待处理蛋白质的目标结构模型:
[0022]将所述初始结构模型内的各第二氨基酸对与所述原始氨基酸序列内的各第一氨基酸对进行比对,确定所述初始结构模型相对于所述原始氨基酸序列的缺失部分;
[0023]针对所述初始结构模型内的各第二氨基酸对,分别确定所述各第二氨基酸对中的两个氨基酸之间的模板距离,并确定各个模板距离与对应的各个实际距离之间的差异值;
[0024]基于各个模板距离与对应的各个实际距离之间的差异值,以及所述缺失部分包含的第一氨基酸对的实际距离,确定所述初始结构模型的分子能量,并根据所述分子能量对所述初始结构模型进行调整。
[0025]在一种可选的实施例中,所述确定各个模板距离与对应的各个实际距离之间的差异值,包括:
[0026]将各个模板距离组成的距离矩阵和各个实际距离组成的距离矩阵均输入差异预测网络,基于所述差异预测网络确定各个模板距离与对应的各个实际距离之间的差异值。
[0027]在一种可选的实施例中,所述基于各个模板距离与对应的各个实际距离之间的差异值,以及所述缺失部分的第一氨基酸对的实际距离,确定所述初始结构模型的分子能量,包括:
[0028]根据各个模板距离与对应的各个实际距离之间的差异值,确定各第二氨基酸对的能量的距离约束参数;
[0029]根据所述各第二氨基酸对的能量的距离约束参数和各第二氨基酸对中的两个氨基酸之间的模板距离,确定所述各第二氨基酸对的距离能量;
[0030]针对所述初始结构模型相对于所述原始氨基酸序列的缺失部分,根据所述缺失部分包含的各第一氨基酸对中的两个氨基酸之间的实际距离,确定所述各第一氨基酸对的距离能量;
[0031]基于所述各第二氨基酸对的距离能量和所述缺失部分包含的各第一氨基酸对的距离能量,确定所述初始结构模型的分子能量。
[0032]在一种可选的实施例中,所述根据最终一轮输出的初始结构模型,确定所述待处理蛋白质的目标结构模型,包括:
[0033]将最终一轮输出的初始结构模型作为第一结构模型;
[0034]随机改变所述第一结构模型中任意氨基酸的位置,得到第二结构模型;
[0035]若所述第二结构模型的分子能量小于所述第一结构模型的分子能量,将所述第二结构模型作为所述待处理蛋白质的目标结构模型。
[0036]在一种可选的实施例中,所述根据最终一轮输出的初始结构模型,确定所述待处理蛋白质的目标结构模型,包括:
[0037]将最终一轮输出的初始结构模型作为第一结构模型;
[0038]调整所述第一结构模型中异常氨基酸对中任意氨基酸的位置,得到第三结构模型;所述异常氨基酸对为模板距离不满足设定距离范围的氨基酸对;
[0039]若所述第三结构模型的分子能量小于所述第一结构模型的分子能量,将所述第三结构模型作为所述待处理蛋白质的目标结构模型。
[0040]第二方面,本申请实施例还提供了一种蛋白质结构模型构建装置,所述装置包括:
[0041]初始模型构建单元,用于基于待处理蛋白质的原始氨基酸序列对应的候选结构模板,构建所述待处理蛋白质的初始结构模型;
[0042]实际距离确定单元,用于针对所述原始氨基酸序列内的各第一氨基酸对,分别确定所述各第一氨基酸对中的两个氨基酸之间的实际距离;
[0043]目标模型确定单元,用于基于所述各第一氨基酸对中的两个氨基酸之间的实际距离,对所述初始结构模型进行调整,得到所述待处理蛋白质的目标结构模型。
[0044]在一种可选的实施例中,所述装置还包括候选模板确定单元,用于:
[0045]基于预设的氨基酸序列与结构本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种蛋白质结构模型构建方法,其特征在于,所述方法包括:基于待处理蛋白质的原始氨基酸序列对应的候选结构模板,构建所述待处理蛋白质的初始结构模型;针对所述原始氨基酸序列内的各第一氨基酸对,分别确定所述各第一氨基酸对中的两个氨基酸之间的实际距离;基于所述各第一氨基酸对中的两个氨基酸之间的实际距离,对所述初始结构模型进行调整,得到所述待处理蛋白质的目标结构模型。2.根据权利要求1所述的方法,其特征在于,所述基于待处理蛋白质的原始氨基酸序列对应的候选结构模板,构建所述待处理蛋白质的初始结构模型之前,还包括:将蛋白质结构数据库中的各氨基酸序列与所述原始氨基酸序列进行序列联配,确定所述各氨基酸序列与所述原始氨基酸序列的相似度;蛋白质结构数据库中保存有所述各氨基酸序列与结构模板之间的对应关系;将相似度最大的氨基酸序列作为与所述原始氨基酸序列相匹配的候选氨基酸序列;将所述候选氨基酸序列对应的结构模板,作为所述原始氨基酸序列对应的候选结构模板。3.根据权利要求1所述的方法,其特征在于,所述针对所述原始氨基酸序列内的各第一氨基酸对,分别确定所述各第一氨基酸对中的两个氨基酸之间的实际距离,包括:确定与所述原始氨基酸序列的相似度满足设定阈值的至少一个参考氨基酸序列;根据各个所述参考氨基酸序列的结构特征生成特征矩阵;将所述特征矩阵输入距离预测网络,基于所述距离预测网络确定所述各第一氨基酸对中的两个氨基酸之间的实际距离。4.根据权利要求1所述的方法,其特征在于,所述基于所述各第一氨基酸对中的两个氨基酸之间的实际距离,对所述初始结构模型进行调整,得到所述待处理蛋白质的目标结构模型,包括:采用循环迭代方式执行如下操作,直至所述初始结构模型的分子能量满足预设的循环迭代条件为止,根据最终一轮输出的初始结构模型,确定所述待处理蛋白质的目标结构模型:将所述初始结构模型内的各第二氨基酸对与所述原始氨基酸序列内的各第一氨基酸对进行比对,确定所述初始结构模型相对于所述原始氨基酸序列的缺失部分;针对所述初始结构模型内的各第二氨基酸对,分别确定所述各第二氨基酸对中的两个氨基酸之间的模板距离,并确定各个模板距离与对应的各个实际距离之间的差异值;基于各个模板距离与对应的各个实际距离之间的差异值,以及所述缺失部分包含的第一氨基酸对的实际距离,确定所述初始结构模型的分子能量,并根据所述分子能量对所述初始结构模型进行调整。5.根据权利要求4所述的方法,其特征在于,所述确定各个模板距离与对应的各个实际距离之间的差异值,包括:将各个模板距离组成的距离矩阵和各个实际距离组成的距离矩阵均输入差异预测网络,通过所述差异预测网络对所述各个模板距离组成的距离矩阵与所述各个实际距离组成的距离矩阵进行比对,确定各个模板距离与对应的各个实际距离之间的差异值。
6.根据权利要求4所述的方法,其特征在于,所述基于各个模板距离与对应的各个实际距离之间的差异值,以及所述缺失部分的第一氨基酸对的实...

【专利技术属性】
技术研发人员:郑良振王晟沈涛兰海东吴家祥裴建国刘伟黄俊洲
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1