蛋白质相互作用的预测方法、装置、设备、介质及产品制造方法及图纸

技术编号：39257779 阅读：10 留言：0更新日期：2023-10-30 12:09

本申请公开了一种蛋白质相互作用的预测方法、装置、设备、介质及产品，属于机器学习技术领域。该方法包括：获取至少两个蛋白质分别对应的氨基酸序列；基于氨基酸序列对注意力语言网络的网络参数进行自适应调整，得到调整后的自适应注意力语言网络；基于自适应注意力语言网络对至少两个蛋白质分别对应的氨基酸序列进行特征提取，得到至少两个蛋白质分别对应的氨基酸序列特征；基于预测网络对至少两个蛋白质分别对应的氨基酸序列特征进行相互作用预测，得到至少两个蛋白质对应的预测结果。通过上述方法，在蛋白质相互作用的预测过程中，可以将注意力语言网络的网络参数进行适应性调整，提高了相互作用预测模型的泛化能力，同时提高了预测精度。时提高了预测精度。时提高了预测精度。

全部详细技术资料下载

【技术实现步骤摘要】
蛋白质相互作用的预测方法、装置、设备、介质及产品

[0001]本申请实施例涉及机器学习
，特别涉及一种蛋白质相互作用的预测方法、装置、设备、介质及产品。

技术介绍

[0002]蛋白质相互作用的预测旨在判断两个或者更多蛋白质之间是否会发生相互作用。
[0003]由于蛋白质是由其对应的氨基酸序列信息决定的，因此，在相关技术中，提取蛋白质的氨基酸序列的特征向量，并将提取的特征向量输入至训练完成的神经网络进行预测处理，从而确定蛋白质之间是否会发生相互作用。
[0004]但相关技术中，由于有限的训练数据量以及训练/测试数据之间的数据分布差异，导致模型学习效果不佳、模型的泛化能力差，即在一些新测试数据或与训练数据数据分布差异较大的测试数据上获取的预测结果的精度较差。

技术实现思路

[0005]本申请提供了一种蛋白质相互作用的预测方法、装置、设备、介质及产品，所述技术方案如下：
[0006]根据本申请的一方面，提供了一种蛋白质相互作用的预测方法，所述方法包括：
[0007]获取至少两个蛋白质分别对应的氨基酸序列；
[0008]基于所述氨基酸序列对所述注意力语言网络的网络参数进行自适应调整，得到调整后的自适应注意力语言网络，所述自适应调整是指在所述蛋白质相互作用的预测过程中，对所述注意力语言网络的网络参数进行调整；
[0009]基于所述自适应注意力语言网络对所述至少两个蛋白质分别对应的所述氨基酸序列进行特征提取，得到所述至少两个蛋白质分别对应的氨基酸序列特征；r/>[0010]基于所述预测网络对所述至少两个蛋白质分别对应的所述氨基酸序列特征进行相互作用预测，得到所述至少两个蛋白质对应的预测结果，所述预测结果用于指示所述至少两个蛋白质之间的相互作用结果。
[0011]根据本申请的一方面，提供了一种相互作用预测模型的训练方法，所述方法包括：
[0012]获取至少两个样本蛋白质分别对应的样本氨基酸序列、所述至少两个样本蛋白质之间的预测结果标签，所述预测结果标签于指示所述至少两个样本蛋白质之间的真实相互作用结果；
[0013]基于所述注意力语言网络对所述至少样本两个蛋白质分别对应的所述样本氨基酸序列进行特征提取，得到所述至少两个蛋白质分别对应的氨基酸序列特征；
[0014]基于所述预测网络对所述至少两个样本蛋白质分别对应的所述样本氨基酸序列特征进行相互作用预测，得到所述至少两个样本蛋白质对应的预测结果，所述预测结果用于指示所述至少两个样本蛋白质之间的相互作用结果；
[0015]基于所述预测结果和所述预测结果标签进行计算，得到训练损失函数值；
[0016]基于所述训练损失函数值对所述相互作用预测模型的网络参数进行更新。
[0017]根据本申请的一方面，提供了一种蛋白质相互作用的预测装置，所述装置包括：
[0018]获取模块，用于获取至少两个蛋白质分别对应的氨基酸序列；
[0019]调整模块，用于基于所述氨基酸序列对所述注意力语言网络的网络参数进行自适应调整，得到调整后的自适应注意力语言网络，所述自适应调整是指在所述蛋白质相互作用的预测过程中，对所述注意力语言网络的网络参数进行调整；
[0020]预测模块，用于基于所述自适应注意力语言网络对所述至少两个蛋白质分别对应的所述氨基酸序列进行特征提取，得到所述至少两个蛋白质分别对应的氨基酸序列特征；
[0021]所述预测模块，还用于基于所述预测网络对所述至少两个蛋白质分别对应的所述氨基酸序列特征进行相互作用预测，得到所述至少两个蛋白质对应的预测结果，所述预测结果用于指示所述至少两个蛋白质之间的相互作用结果。
[0022]根据本申请的一方面，提供了一种相互作用预测模型的训练装置，所述装置包括：
[0023]获取模块，用于获取至少两个样本蛋白质分别对应的样本氨基酸序列、所述至少两个样本蛋白质之间的预测结果标签，所述预测结果标签于指示所述至少两个样本蛋白质之间的真实相互作用结果；
[0024]预测模块，用于基于所述注意力语言网络对所述至少样本两个蛋白质分别对应的所述样本氨基酸序列进行特征提取，得到所述至少两个蛋白质分别对应的氨基酸序列特征；
[0025]所述预测模块，还用于基于所述预测网络对所述至少两个样本蛋白质分别对应的所述样本氨基酸序列特征进行相互作用预测，得到所述至少两个样本蛋白质对应的预测结果，所述预测结果用于指示所述至少两个样本蛋白质之间的相互作用结果；
[0026]计算模块，用于基于所述预测结果和所述预测结果标签进行计算，得到训练损失函数值；
[0027]更新模块，用于基于所述训练损失函数值对所述相互作用预测模型的网络参数进行更新。
[0028]根据本申请的另一方面，提供了一种计算机设备，该计算机设备包括：处理器和存储器，存储器中存储有至少一条计算机程序，至少一条计算机程序由处理器加载并执行以实现如上方面所述的蛋白质相互作用的预测方法，或如上方面所述的相互作用预测模型的训练方法。
[0029]根据本申请的另一方面，提供了一种计算机存储介质，计算机可读存储介质中存储有至少一条计算机程序，至少一条计算机程序由处理器加载并执行以实现如上方面所述的蛋白质相互作用的预测方法，或如上方面所述的相互作用预测模型的训练方法。
[0030]根据本申请的另一方面，提供了一种计算机程序产品，上述计算机程序产品包括计算机程序，所述计算机程序存储在计算机可读存储介质中；所述计算机程序由计算机设备的处理器从所述计算机可读存储介质读取并执行，使得所述计算机设备执行如上方面所述的蛋白质相互作用的预测方法，或如上方面所述的相互作用预测模型的训练方法。
[0031]本申请提供的技术方案带来的有益效果至少包括：
[0032]通过获取至少两个蛋白质分别对应的氨基酸序列；基于氨基酸序列对注意力语言网络的网络参数进行自适应调整，得到调整后的自适应注意力语言网络；基于自适应注意
力语言网络和预测网络对至少两个蛋白质分别对应的氨基酸序列进行相互作用预测，得到至少两个蛋白质对应的预测结果。本申请实施例提供的蛋白质相互作用的预测方法，在蛋白质相互作用的预测过程中，可以将注意力语言网络的网络参数进行适应性调整，提高了相互作用预测模型的泛化能力，同时提高了预测结果的精度。
附图说明
[0033]为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0034]图1是本申请一个示例性实施例提供的一种蛋白质相互作用的预测方法的示意图；
[0035]图2是本申请一个示例性实施例提供的计算机系统的架构示意图；
[0036]图3是本申请一个示例性实施例提供的蛋白质相互作用的预测方法的流程图；
[0037]图4是本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种蛋白质相互作用的预测方法，其特征在于，所述方法应用于相互作用预测模型，所述相互作用预测模型包括注意力语言网络和预测网络；所述方法包括：获取至少两个蛋白质分别对应的氨基酸序列；基于所述氨基酸序列对所述注意力语言网络的网络参数进行自适应调整，得到调整后的自适应注意力语言网络，所述自适应调整是指在所述蛋白质相互作用的预测过程中，对所述注意力语言网络的网络参数进行调整；基于所述自适应注意力语言网络对所述至少两个蛋白质分别对应的所述氨基酸序列进行特征提取，得到所述至少两个蛋白质分别对应的氨基酸序列特征；基于所述预测网络对所述至少两个蛋白质分别对应的所述氨基酸序列特征进行相互作用预测，得到所述至少两个蛋白质对应的预测结果，所述预测结果用于指示所述至少两个蛋白质之间的相互作用结果。2.根据权利要求1所述的方法，其特征在于，所述基于所述氨基酸序列对所述注意力语言网络的网络参数进行自适应调整，得到调整后的自适应注意力语言网络，包括：对所述氨基酸序列中的第一氨基酸进行掩码处理，得到掩码氨基酸序列，所述第一氨基酸是所述氨基酸序列中掩码位置对应的氨基酸，所述第一氨基酸是所述氨基酸序列中的部分氨基酸；基于所述注意力语言网络对所述掩码氨基酸序列中的所述掩码位置进行预测处理，得到所述掩码位置对应的预测氨基酸；基于所述掩码位置处在掩码处理前的所述第一氨基酸和所述预测氨基酸进行计算，得到损失函数值；基于所述损失函数值对所述注意力语言网络的网络参数进行更新，得到所述自适应注意力语言网络。3.根据权利要求2所述的方法，其特征在于，所述基于所述注意力语言网络对所述掩码氨基酸序列中的所述掩码位置进行预测处理，得到所述掩码位置对应的预测氨基酸，包括：获取所述掩码氨基酸序列中未掩码位置的第二氨基酸对应的第二氨基酸特征，所述第二氨基酸是指所述氨基酸序列中所述未掩码位置对应的氨基酸；通过所述注意力语言网络基于所述第二氨基酸特征对所述掩码氨基酸序列中的掩码位置进行预测处理，得到所述掩码位置对应的所述预测氨基酸。4.根据权利要求3所述的方法，其特征在于，所述通过所述注意力语言网络基于所述第二氨基酸特征对所述掩码氨基酸序列中的掩码位置进行预测处理，得到所述掩码位置对应的所述预测氨基酸，包括：通过所述注意力语言网络基于所述未掩码位置的所述第二氨基酸特征，计算氨基酸候选集中每个候选氨基酸的概率值；基于所述概率值最大的候选氨基酸，输出所述预测氨基酸。5.根据权利要求3所述的方法，其特征在于，所述获取所述掩码氨基酸序列中的未掩码位置的氨基酸对应的氨基酸特征，包括：获取所述掩码氨基酸序列中同一未掩码位置的氨基酸子特征及位置特征；将同一所述未掩码位置的所述氨基酸子特征及所述位置特征相加，得到所述未掩码位置对应的所述氨基酸特征。
6.根据权利要求1至5任一所述的方法，其特征在于，所述氨基酸序列包括第一氨基酸序列和第二氨基酸序列；所述基于所述预测网络对所述至少两个蛋白质分别对应的所述氨基酸序列特征进行相互作用预测，得到所述至少两个蛋白质对应的预测结果，包括：将所述第一氨基酸序列和所述第二氨基酸序列输入至所述自适应注意力语言网络进行特征提取，得到所述第一氨基酸序列对应的第一氨基酸序列特征和所述第二氨基酸序列对应的第二氨基酸序列特征；通过所述预测网络基于所述第一氨基酸序列特征和所述第二氨基酸序列特征进行相互作用预测，得到所述第一氨基酸序列和所述第二氨基酸序列之间的所述预测结果。7.根据权利要求6所述的方法，其特征在于，所述通过所述预测网络基于所述第一氨基酸序列特征和所述第二氨基酸序列特征进行相互作用预测，得到所述第一氨基酸序列和所述第二氨基酸序列之间的所述预测结果，包括：通过所述预测网络计算所述第一氨基酸序列特征和所述第二氨基酸序列特征之间的内积，得到相互作用概率矩阵；在所述相互作用概率矩阵的同一行概率值中，将前k个最大数值的平均值作为行取值，得到第一相互作用概率矩阵，k为正整数；在所述第一相互作用概率矩阵的同一列概率值中，将前k个最大数值的平均值作为预测结果取值；基于所述预测结果取值，确定所述第一氨基酸序列和所述第二氨基酸序列之间的所述预测结果。8.一种相互作用预测模型的训练方法，其特征在于，所述方法应用于相互作用预测模型，所述相互作用预测模型包括注意力语言网络和预测网络；所述方法包括：获取至少两个样本蛋白质分别对应的样本氨基酸序列、所述至少两个样本蛋白质之间的预测结果标签，所述预测结果标签于指示所述至少两个样本蛋白质之间的真实相互作用结果；基于所述注意力语言网络对所述至少样本两个蛋白质分别对应的所述样本氨基酸序列进行特征提取，得到所述至少两个蛋白质分别对应...

【专利技术属性】
技术研发人员：吴家祥，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人