基于多模态数据融合增强的药物靶点结合亲和力预测方法技术

技术编号:45609243 阅读:24 留言:0更新日期:2025-06-24 18:40
本发明专利技术提出一种基于多模态数据融合的药物靶点结合亲和力预测方法。该方法首先提取药物SMILES和靶点FASTA的序列特征信息,随后构建亲和力图,以及将药物分子和靶点蛋白质分子建模为无向图,提取原子、键及残基、接触的分子级特征。通过融合亲和力图和分子图的层次图结构信息,获得药物‑靶点的图结构特征表示。进一步使用分子内和分子间的注意力融合机制融合序列特征信息和图结构特征表示。最终,利用这些融合后的特征进行亲和力预测,输出药物‑靶点结合亲和力评分。本发明专利技术有效融合了序列与结构信息,提高了药物靶点亲和力预测的准确性,并解决了现有方法中信息融合不足和结构信息利用不充分的问题。

【技术实现步骤摘要】

本专利技术属于生物信息学和药物发现,涉及一种药物靶点结合亲和力预测方法及系统,特别是涉及一种多模态数据融合技术来增强药物靶点结合亲和力预测的方法及系统。


技术介绍

1、药物靶点亲和力反映了药物与靶点之间的结合强度,是药物研发中的关键目标之一。预测药物靶点对的结合亲和力对于新药的开发具有重要意义(文献1-3)。近年来,深度学习技术被广泛应用于药物靶点亲和力的预测。现有的深度学习方法通常根据输入信息的不同,可以分为三类:基于序列的方法、基于结构的方法和混合模型(文献4-7)。

2、基于序列的方法:这类方法主要依赖药物的smiles格式和靶点的氨基酸序列等序列模态信息进行预测(文献8)。常用的深度学习模型包括卷积神经网络(cnns)(文献9)、循环神经网络(rnns)(文献10)及注意力机制(文献11)等。尽管这些方法通过序列信息进行预测,但早期模型通常通过直接拼接药物和靶点的序列信息来进行预测,未能充分利用不同序列信息之间的潜在互补性。例如,deepdta将从药物smiles和靶点序列中提取的序列信息直接拼接,未能深入挖掘序列信息之间的交互关系(文本文档来自技高网...

【技术保护点】

1.一种基于多模态数据融合增强的药物靶点结合亲和力预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于多模态数据融合增强的药物靶点结合亲和力预测方法,其特征在于:步骤2中,采用扩张卷积网络从药物分子的SMILES字符串和靶点蛋白质分子的FASTA序列中提取有效的序列特征信息;

3.根据权利要求1所述的基于多模态数据融合增强的药物靶点结合亲和力预测方法,其特征在于:步骤3中,构建药物分子和靶点蛋白质分子的亲和力图信息,节点为药物或蛋白质,边为药物和蛋白质之间的亲和力信息,通过图卷积网络GCN学习药物分子和靶点蛋白质分子在亲和力图中的特征表示;

<...

【技术特征摘要】

1.一种基于多模态数据融合增强的药物靶点结合亲和力预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于多模态数据融合增强的药物靶点结合亲和力预测方法,其特征在于:步骤2中,采用扩张卷积网络从药物分子的smiles字符串和靶点蛋白质分子的fasta序列中提取有效的序列特征信息;

3.根据权利要求1所述的基于多模态数据融合增强的药物靶点结合亲和力预测方法,其特征在于:步骤3中,构建药物分子和靶点蛋白质分子的亲和力图信息,节点为药物或蛋白质,边为药物和蛋白质之间的亲和力信息,通过图卷积网络gcn学习药物分子和靶点蛋白质分子在亲和力图中的特征表示;

4.根据权利要求1所述的基于多模态数据融合增强的药物靶点结合亲和力预测方法,其特征在于:步骤3中,构建药物分子和靶点蛋白质分子的亲和力图信息,节点为药物或蛋白质,边为药物和蛋白质之间的亲和力信息,通过图卷积网络gcn学习药物分子与靶点蛋白质分子的亲和力图信息,获得药物分子和靶点蛋白质分子在亲和力图中的特征信息;

5.根据权利要求1所述的基于多模态数据融合增强的药物靶点结合亲和力预测方法,其特征在于:步骤5:通过对步骤3和步骤4中提取的药物...

【专利技术属性】
技术研发人员:胡静周娟张晓龙
申请(专利权)人:武汉科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1