System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于三重特征增强表征的药物靶标相互作用预测方法和系统技术方案_技高网
当前位置: 首页 > 专利查询>湖南大学专利>正文

基于三重特征增强表征的药物靶标相互作用预测方法和系统技术方案

技术编号:41289358 阅读:9 留言:0更新日期:2024-05-11 09:38
本发明专利技术公开了一种基于三重特征增强表征的药物靶标相互作用预测方法,首先提取出待预测药物靶标对数据中药物和靶标的功能子结构,再对药物靶标对数据构建药物‑靶标相互作用对网络,然后构建三重特征学习模块,使用两个Transformer编码器和图神经网络分别对药物、靶标和药物‑靶标相互作用对网络进行特征学习,最后将特征融合后得到三重特征增强表征的药物靶标对表示输入分类器中得到预测结果。本方法在学习药物和靶标个体特征的基础上,增加了药物靶标对网络特征以生成增强表征,在挖掘药物分子中原子信息和靶标氨基酸序列残基信息之外,关注了药物‑靶标相互作用对网络可能提供的潜在直接关联信息。本发明专利技术可以有效学习获取药物靶标相互作用的功能性特征。

【技术实现步骤摘要】

本专利技术属于生物信息与人工智能领域,更具体地,涉及一种基于三重特征增强表征的药物靶标相互作用预测方法和系统


技术介绍

1、预测药物-靶标相互作用是药物发现的一个基本任务。目前,随着人工智能相关技术在生物信息领域的发展,使用深度学习的预测方法也在药物靶标相互作用预测任务上表现出巨大潜力,吸引着众多科研学者的研究兴趣。相比于传统的基于体外实验的相互作用分析方法,利用深度学习技术能够明显缩短时间周期,降低失败风险与成本,从而加速药物研发的进程。

2、现有基于深度学习的药物靶标相互作用预测方法是将原始的药物smiles序列和靶标氨基酸序列作为输入,利用化学描述符、物化属性分析等对输入序列进行编码表示,再借助于特定的自然语言处理模型或神经网络算法等方法(例如word2vec、transformer和cnn等),以提取药物和靶标在更复杂层面上的结构特征和语义特征,挖掘药物和靶标中对于识别相互作用有效的功能性信息。

3、然而,现有基于深度学习的药物靶标相互作用预测方法都具有一些不可忽略的缺陷:

4、第一、这些方法对于药物靶标相互作用机制的理解和建模还不够充分,忽略了相互作用的关键是药物和靶标两者的局部结合,通常不是整个分子结构都参与,而是药物本身具有生物学意义的基团或子结构与靶标序列上的相对独立的功能单元、模体或功能结构域的结合产生的这一理论基础,因此导致模型可解释性偏低;

5、第二、这些方法仅在药物和靶标两者的独立的特征提取过程中能学习到药物分子中的原子信息和靶标氨基酸序列的残基信息,但视角相对局限,对药物-靶标相互作用对整体的功能性特征提取不足,导致模型分类任务预测精度不高;

6、第三、这些方法对于相互作用本身与药物、靶标两者之间的直接关联挖掘得不够深入,因此导致模型泛化性不强。


技术实现思路

1、针对现有技术的以上缺陷或改进需求,本专利技术提供了一种基于三重特征增强表征的深度学习预测方法,其目的在于,解决现有的基于深度学习的药物靶标相互作用预测方法由于忽略了药物和靶标在子结构级别的结合性,导致模型对于药物靶标相互作用机制的理解和建模不够充分的技术问题;以及由于仅对药物和靶标进行独立的特征提取过程,对药物-靶标相互作用对整体功能性特征的提取不足,导致模型分类任务预测精度不高的技术问题;以及无法充分挖掘相互作用本身与药物、靶标两者之间潜在的直接关联,导致模型泛化性不强的技术问题。

2、为实现上述目的,按照本专利技术的一个方面,提供了一种基于三重特征增强表征的药物靶标相互作用预测方法,包括如下步骤:

3、(1)获取待预测的药物靶标对数据,对待预测的药物靶标对数据中每个药物靶标对中的药物进行预处理,以得到药物的原子向量矩阵、原子邻接矩阵和功能子结构集合,并对该药物靶标对中的靶标进行预处理,以得到靶标的特征向量矩阵、靶标功能子结构邻接矩阵和功能子结构集合。

4、(2)为待预测的药物靶标对数据构建药物-靶标相互作用对网络g=(v,e),其中v表示节点集合,e表示边集合,对边集合e进行数据类型转换处理,以得到该药物-靶标相互作用对网络的边连接矩阵,并获取节点集合v的初始特征向量、以及边集合e的属性特征向量。

5、(3)将步骤(1)得到的待预测的药物靶标对数据中每个药物靶标对中药物的原子向量矩阵、每个靶标的特征向量矩阵以及步骤(2)中得到的药物-靶标相互作用对网络的边连接矩阵、节点集合的初始特征向量和边集合的属性特征向量都输入预先训练好的药物靶标相互作用预测模型中,以得到最终的药物靶标相互作用预测结果。

6、优选地,获取待预测的药物靶标对数据中每个药物靶标对中的药物,对该药物进行预处理,以获取药物的原子向量矩阵、原子邻接矩阵和功能子结构集合这一过程具体为,首先使用rdkit工具对smiles字符串的药物进行识别,并将识别结果转换为分子对象,然后,使用one-hot编码方法来提取分子对象中每个原子的特征向量,最后,将所有原子的特征向量进行拼接,即得到该药物的原子向量矩阵,其中每个原子的特征维度为75;此外,将每个原子视为一个功能子结构,所有功能子结构即构成药物的功能子结构集合;此外,定义一个全零的二维矩阵,大小为a×a(其中a为所有的药物的功能子结构的总数),获取分子对象中第一条边两端原子在该分子对象中的原子序号(num11,num12),将二维矩阵中第num11行、第num12列位置的元素设置为1,随后,获取分子对象中第二条边两端原子在该分子对象中的原子序号(num21,num22),将二维矩阵中第num21行、第num22列位置的元素设置为1,…,获取分子对象中第n条边(其中n为分子对象中的边总数)两端原子在该分子对象中的原子序号(numn1,numn2),将二维矩阵中第numn1行、第numn2列位置的元素设置为1,最终得到的二维矩阵就是药物的原子向量矩阵。

7、获取待预测的药物靶标对数据中每个药物靶标对中的靶标,对该靶标进行预处理,以获取靶标的特征向量矩阵、靶标功能子结构邻接矩阵和功能子结构集合这一过程具体为,首先,根据预先建立的氨基酸分类表将氨基酸序列的靶标转化为新的氨基酸序列,然后,采用不重叠的k-gram方法从新的氨基酸序列中切割出多个子序列作为功能子结构,并利用已训练好的word2vec模型对所有功能子结构进行生成向量表示,以得到功能子结构向量,其中每个功能子结构的特征维度为100;最后,将所有功能子结构向量进行拼接,以得到靶标的特征向量矩阵;此外,靶标的所有功能子结构构成靶标的功能子结构集合;此外,定义一个全零的二维矩阵,大小为b×b(其中b为所有的靶标的功能子结构的总数),将所有的靶标的功能子结构进行编号,获取靶标中第一对相邻的两个功能子结构的序号(num11,num12),将二维矩阵中第num11行、第num12列位置的元素设置为1,随后,获取靶标中第二对相邻的两个功能子结构的序号(num21,num22),将二维矩阵中第num21行、第num22列位置的元素设置为1,…,获取靶标中第m对(其中m为靶标中相邻两个功能子结构对的总数)相邻的两个功能子结构的序号(numm1,numm2),将二维矩阵中第numm1行、第numm2列位置的元素设置为1,最终得到的二维矩阵就是靶标的功能子结构邻接矩阵。

8、优选地,构建药物-靶标相互作用对网络g这一过程具体为:首先,为待预测的药物靶标对数据中的第一个药物靶标对构建药物-靶标相互作用对子网络g1=(v1,e1),其中该节点集合v1的节点总数量为k1,该边集合e1的边总数量为r1,随后,对于药物靶标对数据中的每个剩余药物靶标对,重复上述过程,从而得到多个药物-靶标相互作用对子网络g1,g2,…,gb,将所有药物-靶标相互作用对子网络中的所有节点组成的集合(v1、v2、v3、……、vb)汇总成一个新的集合,即节点集合v,同理,将所有药物-靶标相互作用对子网络中的所有边组成的集合(e1、e2、e3、……、eb)汇总成一个新的集合,即边集合e;最后本文档来自技高网...

【技术保护点】

1.一种基于三重特征增强表征的药物靶标相互作用预测方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于三重特征增强表征的药物靶标相互作用预测方法,其特征在于,

3.根据权利要求1或2所述的基于三重特征增强表征的药物靶标相互作用预测方法,其特征在于,构建药物-靶标相互作用对网络G这一过程具体为:首先,为待预测的药物靶标对数据中的第一个药物靶标对构建药物-靶标相互作用对子网络g1=(v1,e1),其中该节点集合v1的节点总数量为k1,该边集合e1的边总数量为r1,随后,对于药物靶标对数据中的每个剩余药物靶标对,重复上述过程,从而得到多个药物-靶标相互作用对子网络g1,g2,…,gB,将所有药物-靶标相互作用对子网络中的所有节点组成的集合(v1、v2、v3、……、vB)汇总成一个新的集合,即节点集合V,同理,将所有药物-靶标相互作用对子网络中的所有边组成的集合(31、e2、e3、……、eB)汇总成一个新的集合,即边集合E;最后,整合节点集合V和边集合E,即得到药物-靶标相互作用对网络G=(V,E),其中该节点集合V的节点总数量为X,其等于k1+k2+…+kB,该边集合E的边总数量为Y,其等于r1+r2+…+rB;

4.根据权利要求1至3中任意一项所述的基于三重特征增强表征的药物靶标相互作用预测方法,其特征在于,

5.根据权利要求4所述的基于三重特征增强表征的药物靶标相互作用预测方法,其特征在于,

6.根据权利要求5所述的基于三重特征增强表征的药物靶标相互作用预测方法,其特征在于,

7.根据权利要求6所述的基于三重特征增强表征的药物靶标相互作用预测方法,其特征在于,

8.根据权利要求7所述的基于三重特征增强表征的药物靶标相互作用预测方法,其特征在于,药物靶标相互作用预测模型是通过以下步骤训练得到的:

9.根据权利要求8所述的基于三重特征增强表征的药物靶标相互作用预测方法,其特征在于,在步骤(3-3)中的具体计算公式如下:

10.一种基于三重特征增强表征的药物靶标相互作用预测系统,其特征在于,包括:

...

【技术特征摘要】

1.一种基于三重特征增强表征的药物靶标相互作用预测方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于三重特征增强表征的药物靶标相互作用预测方法,其特征在于,

3.根据权利要求1或2所述的基于三重特征增强表征的药物靶标相互作用预测方法,其特征在于,构建药物-靶标相互作用对网络g这一过程具体为:首先,为待预测的药物靶标对数据中的第一个药物靶标对构建药物-靶标相互作用对子网络g1=(v1,e1),其中该节点集合v1的节点总数量为k1,该边集合e1的边总数量为r1,随后,对于药物靶标对数据中的每个剩余药物靶标对,重复上述过程,从而得到多个药物-靶标相互作用对子网络g1,g2,…,gb,将所有药物-靶标相互作用对子网络中的所有节点组成的集合(v1、v2、v3、……、vb)汇总成一个新的集合,即节点集合v,同理,将所有药物-靶标相互作用对子网络中的所有边组成的集合(31、e2、e3、……、eb)汇总成一个新的集合,即边集合e;最后,整合节点集合v和边集合e,即得到药物-靶标相互作用...

【专利技术属性】
技术研发人员:曾湘祥杨慧丹刘元盛刘益萍宋勃升王怡君
申请(专利权)人:湖南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1