【技术实现步骤摘要】
蛋白质结构模型构建方法、装置、存储介质和电子设备
[0001]本申请实施例涉及计算机
,尤其涉及一种蛋白质结构模型构建方法、装置、存储介质和电子设备。
技术介绍
[0002]蛋白质结构的预测和优化在医疗健康和生物工程方面都有一定的应用价值,例如,在新药研发中不仅需要了解蛋白质结构信息,还需要持续对蛋白质结构进行优化,酶工程也需要根据蛋白质结构来设计催化活性中心,等等。
[0003]目前可以通过实验方法,例如,X射线结晶、核磁共振以及冷冻电镜等方法来确定蛋白质结构,但是这种方法需要耗费大量时间和高昂的成本,并且经过预测和优化后得到的蛋白质结构的精度不高。
技术实现思路
[0004]为解决相关技术中存在的技术问题,本申请实施例提供一种蛋白质结构模型构建方法、装置、存储介质和电子设备,可以提高蛋白质结构的精度。
[0005]为达到上述目的,本申请实施例的技术方案是这样实现的:
[0006]第一方面,本申请实施例提供了一种蛋白质结构模型构建方法,所述方法包括:
[0007]基于待处理蛋白质的原始氨基酸序列对应的候选结构模板,构建所述待处理蛋白质的初始结构模型;
[0008]针对所述原始氨基酸序列内的各第一氨基酸对,分别确定所述各第一氨基酸对中的两个氨基酸之间的实际距离;
[0009]基于所述各第一氨基酸对中的两个氨基酸之间的实际距离,对所述初始结构模型进行调整,得到所述待处理蛋白质的目标结构模型。
[0010]在一种可选的实施例中,所述基于待处理蛋 ...
【技术保护点】
【技术特征摘要】
1.一种蛋白质结构模型构建方法,其特征在于,所述方法包括:基于待处理蛋白质的原始氨基酸序列对应的候选结构模板,构建所述待处理蛋白质的初始结构模型;针对所述原始氨基酸序列内的各第一氨基酸对,分别确定所述各第一氨基酸对中的两个氨基酸之间的实际距离;基于所述各第一氨基酸对中的两个氨基酸之间的实际距离,对所述初始结构模型进行调整,得到所述待处理蛋白质的目标结构模型。2.根据权利要求1所述的方法,其特征在于,所述基于待处理蛋白质的原始氨基酸序列对应的候选结构模板,构建所述待处理蛋白质的初始结构模型之前,还包括:将蛋白质结构数据库中的各氨基酸序列与所述原始氨基酸序列进行序列联配,确定所述各氨基酸序列与所述原始氨基酸序列的相似度;蛋白质结构数据库中保存有所述各氨基酸序列与结构模板之间的对应关系;将相似度最大的氨基酸序列作为与所述原始氨基酸序列相匹配的候选氨基酸序列;将所述候选氨基酸序列对应的结构模板,作为所述原始氨基酸序列对应的候选结构模板。3.根据权利要求1所述的方法,其特征在于,所述针对所述原始氨基酸序列内的各第一氨基酸对,分别确定所述各第一氨基酸对中的两个氨基酸之间的实际距离,包括:确定与所述原始氨基酸序列的相似度满足设定阈值的至少一个参考氨基酸序列;根据各个所述参考氨基酸序列的结构特征生成特征矩阵;将所述特征矩阵输入距离预测网络,基于所述距离预测网络确定所述各第一氨基酸对中的两个氨基酸之间的实际距离。4.根据权利要求1所述的方法,其特征在于,所述基于所述各第一氨基酸对中的两个氨基酸之间的实际距离,对所述初始结构模型进行调整,得到所述待处理蛋白质的目标结构模型,包括:采用循环迭代方式执行如下操作,直至所述初始结构模型的分子能量满足预设的循环迭代条件为止,根据最终一轮输出的初始结构模型,确定所述待处理蛋白质的目标结构模型:将所述初始结构模型内的各第二氨基酸对与所述原始氨基酸序列内的各第一氨基酸对进行比对,确定所述初始结构模型相对于所述原始氨基酸序列的缺失部分;针对所述初始结构模型内的各第二氨基酸对,分别确定所述各第二氨基酸对中的两个氨基酸之间的模板距离,并确定各个模板距离与对应的各个实际距离之间的差异值;基于各个模板距离与对应的各个实际距离之间的差异值,以及所述缺失部分包含的第一氨基酸对的实际距离,确定所述初始结构模型的分子能量,并根据所述分子能量对所述初始结构模型进行调整。5.根据权利要求4所述的方法,其特征在于,所述确定各个模板距离与对应的各个实际距离之间的差异值,包括:将各个模板距离组成的距离矩阵和各个实际距离组成的距离矩阵均输入差异预测网络,通过所述差异预测网络对所述各个模板距离组成的距离矩阵与所述各个实际距离组成的距离矩阵进行比对,确定各个模板距离与对应的各个实际距离之间的差异值。
6.根据权利要求4所述的方法,其特征在于,所述基于各个模板距离与对应的各个实际距离之间的差异值,以及所述缺失部分的第一氨基酸对的实...
【专利技术属性】
技术研发人员:郑良振,王晟,沈涛,兰海东,吴家祥,裴建国,刘伟,黄俊洲,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。