【技术实现步骤摘要】
本专利技术属于药物研发,尤其涉及一种基于深度学习分类预测药物靶点结合的方法。
技术介绍
1、药物研发过程中,关键一步在于理解药物分子如何与生物体内的大分子(如受体、酶、离子通道、转运体等)相互作用,这些大分子在药物研发任务中称作“靶点”。药物设计正在由传统的完全依靠实验的方法转向使用人工智能模拟计算辅助的综合开发。模拟计算以大数据为支持,能够大幅度缩短药物研发周期,节省实验成本。目前已有许多模型可以预测药物与靶点的结合能力,然而由于数据分布以及模型结构的原因,许多模型在预测时过度依靠小分子信息而忽略了蛋白质的大量特征,以至于更偏向预测分子性质。
2、目前已有大量药物分子和蛋白质数据公开,并出现各种基于这些数据集的算法和网络模型,已取得一定结果。然而目前的模型仍存在局限性,且人工智能领域的前沿技术尚未在生物医药领域得到充分应用。因此,深入探索并分析现有模型在分子及蛋白质数据上的适用性及其局限性,进而设计新型结构以弥补这些不足,并借鉴自然语言处理等领域的最新进展,对推动生物医学研究至关重要。
技术实现
本文档来自技高网...【技术保护点】
1.一种基于深度学习分类预测药物靶点结合的方法,其特征在于,包括以下步骤:
2.根据权利要求1中步骤1所述,其特征在于,在训练MolrProtTrans总体网络之前,使用Brenda和Rhea数据集先预训练Molr模型,更好地表示分子特征。
3.根据权利要求1中步骤2所述,其特征在于,预训练ProtTrans模型来表示蛋白序列。需用超大规模的蛋白质结构空间和属性数据集,包括UniProt,Pruitt等。
4.根据权利要求1中步骤3所述,其特征在于,Transformer架构采用双重注意力机制,将target蛋白矩阵与source分
...【技术特征摘要】
1.一种基于深度学习分类预测药物靶点结合的方法,其特征在于,包括以下步骤:
2.根据权利要求1中步骤1所述,其特征在于,在训练molrprottrans总体网络之前,使用brenda和rhea数据集先预训练molr模型,更好地表示分子特征。
3.根据权利要求1中步骤2所述,其特征在于,预训练prottrans模型来表示蛋白序列。需用超大规模的蛋白质结构空间和属性数据集,包括uniprot,pruitt等。
4.根据权利要求1中步骤3所述,其特征在于,transformer架构采用双重注意力机制,将tar...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。