用于预测蛋白质复合物结构的方法技术

技术编号:39900964 阅读:21 留言:0更新日期:2023-12-30 13:15
本申请的目的是提供用于预测蛋白质复合物结构的方法

【技术实现步骤摘要】
用于预测蛋白质复合物结构的方法、设备、介质及程序产品
[0001]本案为“用于预测蛋白质复合物结构的方法

设备

介质及程序产品”(
申请号:
202310431117.4
,申请日:
2023.04.20)
的分案申请
[0002]本案要求
CN202211078421.7(
申请日
2022

09

05)
的优先权


[0003]本申请涉及人工智能领域,尤其涉及一种用于预测蛋白质复合物结构的技术


技术介绍

[0004]大多数蛋白质以蛋白质复合物的形式发挥作用

因此,获得准确的蛋白质复合物结构对于理解生物功能是如何通过原子水平上的相互作用来实现的是至关重要的

现有技术中可以使用
X
射线晶体分析法

冷冻电镜技术等实验方法来获取高分辨率的蛋白质结构,或者蛋白质复合物结构预测r/>(PCP)...

【技术保护点】

【技术特征摘要】
1.
一种用于预测蛋白质复合物结构的方法,其中,所述方法包括:从蛋白质序列数据库中查询获取目标蛋白质复合物的所有单链
MSA
,其中,每个单链
MSA
对应所述目标蛋白质复合物的一个成分链;基于蛋白质语言模型匹配所有单链
MSA
里面的蛋白质序列,以产生目标蛋白质复合物的
MSA
,其中,所述目标蛋白质复合物的
MSA
基于所述单链
MSA
间的相似度得分矩阵确定,或者基于所述单链
MSA
对应的不同物种组的复合物同源序列确定;将所述目标蛋白质复合物的
MSA
输入深度学习模型以获得所述目标蛋白质复合物的预测结构
。2.
根据权利要求1所述的方法,其中,所述基于蛋白质语言模型匹配所有单链
MSA
里面的蛋白质序列,以产生目标蛋白质复合物的
MSA
,包括:根据物种信息对所述单链
MSA
里的蛋白质序列进行分组,并构建每个物种组对应的复合物同源序列,其中,所述复合物同源序列由同一物种组中排名相同且来自不同单链
MSA
的蛋白质序列连接而成,每个物种组包括零个或者多个复合物同源序列;将所有复合物同源序列构成一个联合
MSA
,其中,该联合
MSA
即所述目标蛋白质复合物的
MSA。3.
根据权利要求2所述的方法,其中,所述根据物种信息对所述单链
MSA
里的蛋白质序列进行分组,并构建每个物种组对应的复合物同源序列包括:根据物种信息以及所述单链
MSA
,确定一个或者多个物种组,其中,每个物种组对应所述物种信息中一个物种,每个物种组包括多个子分类组,每个子分类组对应一个单链
MSA
,该子分类组包含该单链
MSA
中属于该物种的蛋白质序列;根据所述一个或者多个物种组,确定每个物种组对应的复合物同源序列
。4.
根据权利要求3所述的方法,其中,所述根据所述一个或者多个物种组,确定每个物种组对应的复合物同源序列包括:确定每个物种组中所有子分类组中每个蛋白质序列对应的相似度评分信息;基于所述相似度评分信息,确定每个物种组对应的复合物同源序列
。5.
根据权利要求4所述的方法,其中,所述确定每个物种组中所有子分类组中每个蛋白质序列对应...

【专利技术属性】
技术研发人员:许锦波
申请(专利权)人:北京分子之心科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1