蛋白质间相互作用的预测方法、装置及电子设备制造方法及图纸

技术编号:38465990 阅读:22 留言:0更新日期:2023-08-11 14:43
本申请实施例提供了一种蛋白质间相互作用的预测方法、装置、电子设备及计算机可读存储介质,涉及计算机技术领域。本申请实施中,第一氨基酸序列及第二氨基酸序列分别作为第一蛋白质及第二蛋白质的组成部分,第一氨基酸序列与第二氨基酸序列之间的序列关联关系可以反应第一蛋白质与第二蛋白质之间的关系。这样,通过序列关联关系预测所述第一蛋白质与所述第二蛋白质之间的相互作用信息,可以提升预测的准确度。测的准确度。测的准确度。

【技术实现步骤摘要】
蛋白质间相互作用的预测方法、装置及电子设备


[0001]本申请涉及计算机
,具体而言,本申请涉及一种蛋白质间相互作用的预测方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]蛋白质相互作用研究能够从分子水平上揭示蛋白质的功能,帮助揭示生长发育、新陈代谢、分化和凋亡等细胞活动的规律。在全基因组范围内识别蛋白质相互作用是解释细胞调控机制的重要一步。
[0003]随着蛋白质相互作用实验技术的发展,人们能够获得大量的蛋白质相互作用数据,甚至能够在全基因组范围内对蛋白质相互作用进行分析。然而,由于实验技术的限制,通过实验检测来确定蛋白质间的相互作用的方式耗费大量人力资源且效率较低,不适用于大规模的检测。

技术实现思路

[0004]本申请的目的旨在至少能解决上述的技术缺陷之一,特别是传统实验方法不适用于大规模蛋白质相互作用检测的技术缺陷。
[0005]根据本申请的一个方面,提供了一种蛋白质间相互作用的预测方法,该方法包括:
[0006]获取第一蛋白质的氨基酸序列,所述第一蛋白质的氨基酸序列包括多个第一氨基酸序列;分别获取每个所述第一氨基酸序列的第一序列信息;
[0007]获取第二蛋白质的氨基酸序列,所述第二蛋白质的氨基酸序列包括多个第二氨基酸序列;分别获取每个所述第二氨基酸序列的第二序列信息;
[0008]根据所述第一序列信息以及所述第二序列信息,确定所述第一氨基酸序列与所述第二氨基酸序列之间的序列关联关系;
[0009]根据所述序列关联关系,预测所述第一蛋白质与所述第二蛋白质之间的相互作用信息。
[0010]可选地,所述第一序列信息包括:所述第一氨基酸序列的第一特征信息,以及所述第一蛋白质包括的所述第一氨基酸序列的第一数量信息,
[0011]所述第二序列信息包括:所述第二氨基酸序列的第二特征信息,以及所述第二蛋白质包括的所述第二氨基酸序列的第二数量信息,
[0012]所述根据所述第一序列信息以及第二序列信息,确定所述第一氨基酸序列与所述第二氨基酸序列之间的序列关联关系,包括:
[0013]确定所述第一数量信息与所述第二数量信息之间的第一关联关系;以及确定所述第一特征信息与所述第二特征信息的第二关联关系;
[0014]根据所述第一关联关系及所述第二关联关系,确定所述序列关联关系。
[0015]可选地,所述确定所述第一数量信息与所述第二数量信息之间的第一关联关系,包括:
[0016]根据预设概率分布算法,确定所述第一数量信息与所述第二数量信息之间的相似度,得到所述第一关联关系。
[0017]可选地,所述确定所述第一特征信息与所述第二特征信息的第二关联关系,包括:
[0018]根据所述第一特征信息与所述第二特征信息,确定所述第一氨基酸序列与第二氨基酸序列的特征关联关系;
[0019]根据所述特征关联关系,确定所述第二关联关系。
[0020]可选地,所述第一关联关系对应的数据关系包括:
[0021][0022]其中,Φ(K|u
i
)表示第一关联关系;K表示第二氨基酸序列的数量;λ(ui)表示ui中第一氨基酸序列的数量的期望;ui表示所述第一蛋白质。
[0023]可选地,所述第二关联关系对应的数据关系包括:
[0024][0025]其中,Y表示所述第二关联关系;M表示第一氨基酸序列的数量;K表示第二氨基酸序列的数量;null表示预设氨基酸序列;表示所述第二蛋白质u
j
中的第k个第二氨基酸序列;
[0026]其中,p
ml
(w|u
i
)表示从所述第一蛋白质u
i
中选出任意一个所述第一氨基酸序列w的概率;
[0027]表示所述预设氨基酸序列与之间的条件概率。
[0028]可选地,所述序列关联关系对应的数据关系包括:
[0029]p(u
j
|u
i
)=YΦ(K|u
i
);
[0030]其中,Y表示所述第二关联关系;Φ(K|u
i
)表示第一关联关系。
[0031]可选地,确定所述序列关联关系、根据所述序列关联关系,预测所述第一蛋白质与所述第二蛋白质之间的相互作用信息,包括:
[0032]将所述第一序列信息以及所述第二序列信息输入至预设预测模型,得到所述第一蛋白质与所述第二蛋白质之间的相互作用信息。
[0033]可选地,所述将所述第一序列信息以及所述第二序列信息输入至预设预测模型之前,所述方法还包括:
[0034]获取训练样本;其中,所述训练样本包括:样本蛋白质对以及所述样本蛋白质对对应的样本关联关系;所述样本蛋白质对包括第一样本蛋白质及第二样本蛋白质;
[0035]将所述训练样本输入初始预测模型中,得到每个所述训练样本对应的预测结果;
[0036]根据所述样本关联关系及所述预测结果,确定训练损失值;
[0037]基于所述训练损失值,对所述初始模型进行重复训练,直至得到符合训练结束条件的所述预设预测模型。
[0038]可选的,所述训练损失值对应的数据关系包括:
[0039][0040]其中,L表示所述训练损失值;|q
i
|表示所述第一样本蛋白质q
i
中所述第一氨基酸序列的数量;|a
i
|表示所述第二样本蛋白质a
i
中所述第二氨基酸序列的数量。表示q
i
中第k个所述第一氨基酸序列;null表示预设氨基酸序列;H表示所述样本蛋白质对的数量。
[0041]可选地,所述序列关联关系包括关联关系值,
[0042]所述根据所述序列关联关系,预测所述第一蛋白质与所述第二蛋白质之间的相互作用信息,包括:
[0043]将所述关联关系值与预设关系阈值进行比较,确定所述第一蛋白质与所述第二蛋白质之间的相互作用信息;
[0044]所述相互作用信息指示所述第一蛋白质与所述第二蛋白质是否发生相互作用。
[0045]根据本申请的另一个方面,提供了一种蛋白质间相互作用的预测方法,该装置包括:
[0046]获取模块,用于获取第一氨基酸序列的第一序列信息以及第二氨基酸序列的第二序列信息;其中,所述第一氨基酸序列包括第一蛋白质的氨基酸,所述第二氨基酸序列包括第二蛋白质的氨基酸;
[0047]确定模块,用于根据所述第一序列信息以及第二序列信息,确定所述第一氨基酸序列与所述第二氨基酸序列之间的序列关联关系;
[0048]预测模块,用于根据所述序列关联关系,预测所述第一蛋白质与所述第二蛋白质之间的相互作用信息。
[0049]根据本申请的另一个方面,提供了一种电子设备,该电子设备包括:
[0050]一个或多个处理器;
[0051]存储器;
[0052]一个或多个应用程序,其中所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种蛋白质间相互作用的预测方法,其特征在于,包括:获取第一蛋白质的氨基酸序列,所述第一蛋白质的氨基酸序列包括多个第一氨基酸序列;分别获取每个所述第一氨基酸序列的第一序列信息;获取第二蛋白质的氨基酸序列,所述第二蛋白质的氨基酸序列包括多个第二氨基酸序列;分别获取每个所述第二氨基酸序列的第二序列信息;根据所述第一序列信息以及所述第二序列信息,确定所述第一氨基酸序列与所述第二氨基酸序列之间的序列关联关系;根据所述序列关联关系,预测所述第一蛋白质与所述第二蛋白质之间的相互作用信息。2.根据权利要求1所述的预测方法,其特征在于,所述第一序列信息包括:所述第一氨基酸序列的第一特征信息,以及所述第一蛋白质包括的所述第一氨基酸序列的第一数量信息,所述第二序列信息包括:所述第二氨基酸序列的第二特征信息,以及所述第二蛋白质包括的所述第二氨基酸序列的第二数量信息,所述根据所述第一序列信息以及所述第二序列信息,确定所述第一氨基酸序列与所述第二氨基酸序列之间的序列关联关系,包括:确定所述第一数量信息与所述第二数量信息之间的第一关联关系;以及确定所述第一特征信息与所述第二特征信息的第二关联关系;根据所述第一关联关系及所述第二关联关系,确定所述序列关联关系。3.根据权利要求2所述的预测方法,其特征在于,所述确定所述第一数量信息与所述第二数量信息之间的第一关联关系,包括:根据预设概率分布算法,确定所述第一数量信息与所述第二数量信息之间的相似度,得到所述第一关联关系。4.根据权利要求2所述的预测方法,其特征在于,所述确定所述第一特征信息与所述第二特征信息的第二关联关系,包括:根据所述第一特征信息与所述第二特征信息,确定所述第一氨基酸序列与第二氨基酸序列的特征关联关系;根据所述特征关联关系,确定所述第二关联关系。5.根据权利要求2所述的预测方法,其特征在于,所述第一关联关系对应的数据关系包括:其中,Φ(K|u
i
)表示所述第一关联关系;K表示所述第二氨基酸序列的数量;λ(ui)表示ui中所述第一氨基酸序列的数量的期望;ui表示所述第一蛋白质。6.根据权利要求5所述的预测方法,其特征在于,所述第二关联关系对应的数据关系包括:
其中,Y表示所述第二关联关系;M表示所述第一氨基酸序列的数量;K表示所述第二氨基酸序列的数量;null表示预设氨基酸序列;表示所述第二蛋白质u
j
中的第k个所述第二氨基酸序列;其中,p
ml
(w|u
i
)表示从所述第一蛋白质u
i
中选出任意一个所述第一氨基酸序列w的概率;表示所述预设氨基酸序列与之间的条件概率。7.根据权利要求6所述的预测方法,其特征在于,所述序列关联关系对应的数据关系包括:p(u
j
|u
i
)=yΦ(K|u
i
);其中,p(u
j
|u
i
)表示...

【专利技术属性】
技术研发人员:张振中
申请(专利权)人:京东方科技集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1