【技术实现步骤摘要】
本专利技术属于深度学习及药物虚拟筛选领域,涉及预测药物与靶点相互作用的方法,尤其涉及基于蛋白质序列的药物靶点相互作用预测方法。
技术介绍
1、药物虚拟筛选是寻找新骨架苗头分子和先导化合物的重要方法。基于蛋白质结构的虚拟筛选需要药物靶点的三维结构,而基于药物配体的虚拟筛选则需要已知的活性分子。鉴于现有方法的局限性,基于蛋白质序列的方法可以克服这些限制,有更广泛的应用价值。
2、人工智能广泛应用于药物靶点相互作用预测,将其视为二分类任务。传统的机器学习方法通过输入预定义的描述符进行预测,深度学习则通过自动学习药物和靶点的特征来完成预测。深度学习通常利用神经网络结构,如卷积神经网络或图神经网络,以捕捉复杂的特征和关系,从而在预测准确性上优于传统机器学习方法。
3、然而,深度学习在预测药物靶点相互作用方面仍面临以下问题:1)药物与靶点的特征独立表示不能有效地学习它们之间的相互作用;2)模型对未见过的靶点体系的泛化能力不足;3)深度学习模型的预测结果缺乏可解释性。
技术实现思路
< ...【技术保护点】
1.一种基于蛋白质序列的药物靶点预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,步骤(1)中,药物靶点相互作用数据库的获取,具体包括:根据靶点名称获取对应的蛋白质的UniProt序列和根据化学信息包获取的药物SMILES序列。
3.根据权利要求1所述的方法,其特征在于,步骤(2)中,所述基于预训练蛋白质语言模型的靶点特征提取器,包括:根据开源的预训练蛋白质语言模型,调用线性层,用于对输入的靶点UniProt序列进行特征提取,输出以氨基酸为单位的靶点特征。
4.根据权利要求1所述的方法,其特征在于,步骤
...【技术特征摘要】
1.一种基于蛋白质序列的药物靶点预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,步骤(1)中,药物靶点相互作用数据库的获取,具体包括:根据靶点名称获取对应的蛋白质的uniprot序列和根据化学信息包获取的药物smiles序列。
3.根据权利要求1所述的方法,其特征在于,步骤(2)中,所述基于预训练蛋白质语言模型的靶点特征提取器,包括:根据开源的预训练蛋白质语言模型,调用线性层,用于对输入的靶点uniprot序列进行特征提取,输出以氨基酸为单位的靶点特征。
4.根据权利要求1所述的方法,其特征在于,步骤(3)中,所述构建基于预训练分子模型的药物特征提取器,包括:根据开源的预训练分子模型,调用线性层,用于对输入的药物smiles进...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。