当前位置: 首页 > 专利查询>浙江大学专利>正文

基于蛋白质序列的药物靶点相互作用预测方法技术

技术编号:44664705 阅读:24 留言:0更新日期:2025-03-19 20:22
本发明专利技术公开了一种基于蛋白质序列的药物靶点相互作用预测方法,包括:构建药物靶点数据库;构建基于预训练蛋白质语言模型的靶点特征提取器;构建基于预训练分子模型的药物特征提取器;采用自注意力机制构建特征学习方法,采用交叉注意力机制构建药物靶点相互作用学习方法,结合线性层构建预测器,搭建预测药物靶点相互作用模型;训练并优化药物靶点相互作用预测模型的参数,得到优化后的药物靶点预测模型;药物靶点输入到优化后的预测模型中,输出预测结果,最后通过注意力分数可视化,标注出药物与靶点潜在的活性位点和重要氨基酸残基。本发明专利技术实现了基于蛋白质序列预测药物与靶点相互作用精度的提升,并实现了深度学习模型的可解释性。

【技术实现步骤摘要】

本专利技术属于深度学习及药物虚拟筛选领域,涉及预测药物与靶点相互作用的方法,尤其涉及基于蛋白质序列的药物靶点相互作用预测方法


技术介绍

1、药物虚拟筛选是寻找新骨架苗头分子和先导化合物的重要方法。基于蛋白质结构的虚拟筛选需要药物靶点的三维结构,而基于药物配体的虚拟筛选则需要已知的活性分子。鉴于现有方法的局限性,基于蛋白质序列的方法可以克服这些限制,有更广泛的应用价值。

2、人工智能广泛应用于药物靶点相互作用预测,将其视为二分类任务。传统的机器学习方法通过输入预定义的描述符进行预测,深度学习则通过自动学习药物和靶点的特征来完成预测。深度学习通常利用神经网络结构,如卷积神经网络或图神经网络,以捕捉复杂的特征和关系,从而在预测准确性上优于传统机器学习方法。

3、然而,深度学习在预测药物靶点相互作用方面仍面临以下问题:1)药物与靶点的特征独立表示不能有效地学习它们之间的相互作用;2)模型对未见过的靶点体系的泛化能力不足;3)深度学习模型的预测结果缺乏可解释性。


技术实现思路

<p>1、本专利技术的本文档来自技高网...

【技术保护点】

1.一种基于蛋白质序列的药物靶点预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,步骤(1)中,药物靶点相互作用数据库的获取,具体包括:根据靶点名称获取对应的蛋白质的UniProt序列和根据化学信息包获取的药物SMILES序列。

3.根据权利要求1所述的方法,其特征在于,步骤(2)中,所述基于预训练蛋白质语言模型的靶点特征提取器,包括:根据开源的预训练蛋白质语言模型,调用线性层,用于对输入的靶点UniProt序列进行特征提取,输出以氨基酸为单位的靶点特征。

4.根据权利要求1所述的方法,其特征在于,步骤(3)中,所述构建基...

【技术特征摘要】

1.一种基于蛋白质序列的药物靶点预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,步骤(1)中,药物靶点相互作用数据库的获取,具体包括:根据靶点名称获取对应的蛋白质的uniprot序列和根据化学信息包获取的药物smiles序列。

3.根据权利要求1所述的方法,其特征在于,步骤(2)中,所述基于预训练蛋白质语言模型的靶点特征提取器,包括:根据开源的预训练蛋白质语言模型,调用线性层,用于对输入的靶点uniprot序列进行特征提取,输出以氨基酸为单位的靶点特征。

4.根据权利要求1所述的方法,其特征在于,步骤(3)中,所述构建基于预训练分子模型的药物特征提取器,包括:根据开源的预训练分子模型,调用线性层,用于对输入的药物smiles进...

【专利技术属性】
技术研发人员:盛荣陈庚廖金标俞言真
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1