一种基于深度学习分类预测药物靶点结合的方法技术

技术编号：43777584 阅读：77 留言：0更新日期：2024-12-24 16:14

本发明专利技术公开了一种基于深度学习分类预测药物靶点结合的方法，为了克服现有现有模型在分子及蛋白质数据上的适用性及其局限性，以transformer为主体结构，分别使用Molr和ProtTrans作为提取分子和蛋白质信息的网络组合成模型MolrProtTrans。随后，加入对模型的简化以及对比测试，并将原模型生成的向量对接到机器学习模型中，预测指定的药物和靶点序列结合的逻辑，模型将得出0或1的值代表是否结合，测试指标为分类任务中普遍的ROC曲线以及准确率，召回率等。本发明专利技术旨在迅速判定新药物最基本的属性，采用本发明专利技术提出的模型MolrProtTrans，能快速筛选出和指定蛋白产生作用的有效药物。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于药物研发，尤其涉及一种基于深度学习分类预测药物靶点结合的方法。

技术介绍

1、药物研发过程中，关键一步在于理解药物分子如何与生物体内的大分子(如受体、酶、离子通道、转运体等)相互作用，这些大分子在药物研发任务中称作“靶点”。药物设计正在由传统的完全依靠实验的方法转向使用人工智能模拟计算辅助的综合开发。模拟计算以大数据为支持，能够大幅度缩短药物研发周期，节省实验成本。目前已有许多模型可以预测药物与靶点的结合能力，然而由于数据分布以及模型结构的原因，许多模型在预测时过度依靠小分子信息而忽略了蛋白质的大量特征，以至于更偏向预测分子性质。

2、目前已有大量药物分子和蛋白质数据公开，并出现各种基于这些数据集的算法和网络模型，已取得一定结果。然而目前的模型仍存在局限性，且人工智能领域的前沿技术尚未在生物医药领域得到充分应用。因此，深入探索并分析现有模型在分子及蛋白质数据上的适用性及其局限性，进而设计新型结构以弥补这些不足，并借鉴自然语言处理等领域的最新进展，对推动生物医学研究至关重要。

技术实现思路

本文档来自技高网...

【技术保护点】

1.一种基于深度学习分类预测药物靶点结合的方法，其特征在于，包括以下步骤：

2.根据权利要求1中步骤1所述，其特征在于，在训练MolrProtTrans总体网络之前，使用Brenda和Rhea数据集先预训练Molr模型，更好地表示分子特征。

3.根据权利要求1中步骤2所述，其特征在于，预训练ProtTrans模型来表示蛋白序列。需用超大规模的蛋白质结构空间和属性数据集，包括UniProt，Pruitt等。

4.根据权利要求1中步骤3所述，其特征在于，Transformer架构采用双重注意力机制，将target蛋白矩阵与source分子矩阵做乘积，获得向...

【技术特征摘要】

1.一种基于深度学习分类预测药物靶点结合的方法，其特征在于，包括以下步骤：

2.根据权利要求1中步骤1所述，其特征在于，在训练molrprottrans总体网络之前，使用brenda和rhea数据集先预训练molr模型，更好地表示分子特征。

3.根据权利要求1中步骤2所述，其特征在于，预训练prottrans模型来表示蛋白序列。需用超大规模的蛋白质结构空间和属性数据集，包括uniprot，pruitt等。

4.根据权利要求1中步骤3所述，其特征在于，transformer架构采用双重注意力机制，将tar...

【专利技术属性】
技术研发人员：王健，林益存，李沅峰，
申请(专利权)人：吉林大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人