System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于深度对比学习的激酶药物相互作用预测方法技术_技高网
当前位置: 首页 > 专利查询>鲁东大学专利>正文

一种基于深度对比学习的激酶药物相互作用预测方法技术

技术编号:41063113 阅读:4 留言:0更新日期:2024-04-24 11:16
本发明专利技术属于生物信息学领域,涉及一种基于深度对比学习的激酶药物相互作用预测方法。通过将药物分子向量和靶标蛋白质向量输入线性层使它们可以在同一空间维度下进行训练,训练后可以获得具有更好预测效果的激酶药物相互作用预测模型。该方法使用了深度对比学习技术,其步骤包括:药物与靶标投影器的预处理、计算分子和蛋白质特征相似性、基于对比学习的神经网络训练和预测四个过程。该方法可以分析大量的分子结构和生物信息学数据,加速药物发现和设计过程,缩短药物研发周期,降低成本,并促进新药物的发现。

【技术实现步骤摘要】

本专利技术属于生物信息学领域,涉及一种基于深度对比学习的激酶药物相互作用预测方法,其中包括深度学习、对比学习、卷积神经网络等技术。


技术介绍

1、药物发现的过程中,实验筛选小分子以确定其在蛋白质靶点上的结合是十分昂贵的步骤之一。因此,精准、高通量的计算预测药物与靶点的相互作用,有助于优先考虑潜在的实验筛选候选物。通过计算预测,可以减少实验室工作量,节省成本和时间,快速识别潜在的药物靶点相互作用,使得候选物质更快地进入实验验证阶段。使用深度学习来预测激酶药物相互作用可以通过分析大量的分子结构和生物信息数据,加速药物发现和设计过程。同时可以缩短药物研发周期,降低成本,并促进新药物的发现。


技术实现思路

1、本专利技术提出了一种基于深度对比学习的激酶药物相互作用预测方法,包括药物与靶标投影器的预处理、计算分子和蛋白质特征相似性、基于对比学习的神经网络训练和预测四个过程,其具体步骤如下:

2、步骤1、将药物分子和靶标蛋白质数据投影到一个潜在空间中,输入到卷积层,并执行线性变化和激活函数操作,得到药物投影器和靶标投影器;将药物分子数据和靶标蛋白质数据输入到对应的投影器中,得到潜在空间中的分子嵌入张量和蛋白质嵌入张量;

3、步骤2、基于步骤1的投影器得到的分子和蛋白质的嵌入张量,将药物分子向量和靶标蛋白质向量输入到全连接层,使它们在同一空间维度下,计算嵌入张量之间的余弦相似度,用于计算药物-靶标相互作用的概率;

4、步骤3、将步骤2中处理后的数据输入基于对比学习的并行神经网络,包含一个全连接层将输入的特征从100维映射到4096维,一个dropout层,再设置一个全连接层从4096维映射到1024维,最后是一个dropout层;训练并保存激酶药物相互作用预测模型;

5、步骤4、将需要预测的药物和靶标数据的特征经过步骤1处理后输入步骤3中保存好的模型,以预测激酶药物相互作用。

6、一种基于深度对比学习的激酶药物相互作用预测方法,步骤1的实现过程如下:

7、将2048维的药物分子和1024维的靶标蛋白质数据投影到一个潜在空间中,每个投影器都包含两个卷积层,两个全连接层和一个激活函数;处理药物分子,使用两个卷积层处理数据,将处理后的数据输入到全连接层中,将数据从2048维降低到1024维,将降维后的数据输入到药物投影器中,第二层再设置一个全连接层,不改变数据的维数,输入数据和输出数据保持在1024维,该全连接层使用relu激活函数;处理靶标蛋白质数据,使用两个卷积层处理数据,将处理好的数据输出到两个全连接层中,维度不发生改变,该全连接层也使用relu激活函数;通过foldseek索引,将处理后的药物分子和靶标蛋白质分子输入到嵌入层,其中嵌入层的大小为 (22, 1024),用于处理 22 个索引,每个索引的嵌入维度为 1024;通过将 foldseek 索引传递给嵌入层,得到蛋白质语言模型嵌入;通过对这个张量沿着维度1进行均值池化,得到一个平均后的单个foldseek 嵌入张量。将蛋白质语言模型嵌入和foldseek 嵌入拼接在一起,形成完整的蛋白质嵌入,得到药物的分子嵌入表示和靶标的蛋白质嵌入表示。将药物分子的嵌入表示和靶标蛋白质分子的嵌入表示输入到对应的药物和靶标投影器中,得到潜在空间中的表示。

8、一种基于深度对比学习的激酶药物相互作用预测方法,步骤2的实现过程如下:

9、通过步骤1得到分子和蛋白质的嵌入张量,使用一个双向长短时间记忆网络来处理蛋白质的嵌入序列,得到蛋白质的隐藏状态;将分子嵌入张量使用全连接层从2048维映射到1024维,该全连接层使用relu激活函数;将蛋白质嵌入张量使用全连接层从100维映射到1024维,该全连接层也使用relu激活函数;将处理后的分子和蛋白质的嵌入张量传递给药物和靶标的投影器,并通过批标准化层进行规范化处理,并输入到余弦相似度函数;通过接收分子和蛋白质的嵌入张量,返回余弦距离度量计算得到的分子和蛋白质嵌入之间的相似度。

10、一种基于深度对比学习的激酶药物相互作用预测方法,步骤3的实现过程如下:

11、将步骤2中处理后的样本向量输入基于对比学习的并行神经网络,包含一个全连接层将输入的特征从100维映射到4096维,该全连接层使用relu激活函数,一个dropout层用于正则化,以50%的概率丢弃部分神经元的输出。再设置一个全连接层从4096维映射到1024维,该全连接层使用relu激活函数,一个dropout层,以20%的概率丢弃部分神经元的输出;将处理后的数据使用广义的torch.sigmoid 激活函数避免处理后的训练数据下溢出;训练并保存激酶药物相互作用预测模型。

12、一种基于深度对比学习的激酶药物相互作用预测方法,步骤4的实现过程如下:

13、将需要预测的药物分子和蛋白质嵌入数据经过步骤1分别输入到对应的药物和靶标数据投影器中,输入步骤3中保存好的模型,得到药物分子和蛋白质分子1024维的向量,再通过计算余弦相似度返回分子嵌入和蛋白质嵌入之间的相似性,作为激酶药物相互作用的结果。

本文档来自技高网...

【技术保护点】

1.一种基于深度对比学习的激酶药物相互作用预测方法,其特征在于,通过计算药物与靶标的相互作用,获得更好的预测模型,快速识别潜在的药物靶点相互作用,将药物分子向量和靶标蛋白质向量放在同一空间下进行训练,包括药物与靶标投影器的预处理、计算分子和蛋白质特征相似性、基于对比学习的神经网络的训练和预测四个过程,其具体步骤如下:

2.根据权利要求1所述的一种基于深度对比学习的激酶药物相互作用预测方法,其特征在于,将药物分子向量和靶标蛋白质向量通过卷积层和线性层预处理得到投影器,再将数据输入到投影器中训练,投影器预处理的实现过程如下:

【技术特征摘要】

1.一种基于深度对比学习的激酶药物相互作用预测方法,其特征在于,通过计算药物与靶标的相互作用,获得更好的预测模型,快速识别潜在的药物靶点相互作用,将药物分子向量和靶标蛋白质向量放在同一空间下进行训练,包括药物与靶标投影器的预处理、计算分子和蛋白质特征相似性、基于对比学习...

【专利技术属性】
技术研发人员:李锦龙周树森刘通柳婵娟王庆军臧睦君
申请(专利权)人:鲁东大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1