【技术实现步骤摘要】
基于深度迁移学习模型的药物分子骨架替换和筛选方法
[0001]本专利技术涉及计算机辅助药物研发领域,尤其涉及一种基于深度迁移学习模型的药物分子骨架替换和筛选方法。
技术介绍
[0002]药物研发的总体过程耗时长、成本高、成功率低。从获得临床批件到药物上市过程中的临床失败率超过90%,而推进一个新的治疗药物到上市审批的相关成本预计高达20亿美元以上,且平均需要15年。早期的计算机辅助药物设计方法主要有定量构效关系(QSAR)模型,即利用回归模型来寻找分子描述符合生物活性之间的联系。与此同时,机器学习方法(如支持向量机、随机森林和决策树)已被应用于药物发现任务中。但由于特征提取较少,整体预测效果不佳。此外,传统的“骨架跃迁”概念强调骨架跃迁的两个关键组成部分:新化合物相对于模板化合物具有不同的骨架结构,但有相似的生物活性。骨架跃迁的原理是结构相似的分子其活性也相似。但是,传统的骨架跃迁方法存在结构相似性与活性结果的相关性不足、新骨架合成难度和成本较高、骨架新颖性较低等问题。
[0003]随着人工智能技术的蓬勃进步,人工智 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度迁移学习模型的药物分子骨架替换和筛选方法,其特征在于,包括如下步骤:步骤一,获取源域数据集和目标域数据集;步骤二,将待筛选化合物以及步骤一所获得的源域数据集和目标域数据集的对应化合物分别转变为化合物骨架;步骤三,输入步骤二所获得的源域数据集对应化合物骨架的简化分子线性输入规范格式文本和生物活性数据到图神经网络模型中预训练得到网络模型;步骤四,将步骤二所获得的目标域数据集对应化合物骨架的简化分子线性输入规范格式文本和生物活性数据输入到步骤三获得的预训练好的网络模型中,并对该网络模型中参数进行微调,得到新的参数及模型;步骤五,基于步骤四得到的针对目标域数据集的深度学习网络模型对待筛选化合物进行骨架综合筛选,获得分子骨架综合得分,筛选出分子骨架;步骤六,将上述筛选出的分子骨架替换到目标小分子化合物中,获得系列骨架替换后的全新分子。2.根据权利要求1所述的基于深度迁移学习模型的药物分子骨架替换和筛选方法,其特征在于,所述目标域数据集是小样本数据集,源域数据集是目标域关联任务的大样本数据集;所述源域数据集和目标域数据集从Pubchem、ChEMBL、BindingDB等公开数据库和公开文献中获得。3.根据权利要求2所述的基于深度迁移学习模型的药物分子骨架替换和筛选方法,其特征在于,所述步骤二具体包括:使用开源包RDkit中基于的Murcko骨架聚类化合物库对源域化合物、目标域化合物和待筛选化合物进行骨架提取。4.根据权利要求1
‑
3任一项所述的基于深度迁移学习模型的药物分子骨架替换和筛选方法,其特征在于,所述图神经网络模型包括定向消息传递神经网络模块、前馈神经网络模块,所述定向消息传递神经网络模块用于提取分子特征;所述前馈神经网络模块用于完成分子性质的分类和预测。5.根据权利要求4所述的基于深度迁移学习模型的药物分子骨架替换和筛选方法,其特征在于,在将源域数据集对应化合物骨架的简化分子线性输入规范格式文本,即smiles文本输入到图神经网络模型中前,使用开源包RDkit对输入的源域数据集对应化合物smiles文本进行计算,获得对应的小分子化合物的原子特征x
v
和化学键特征e
vw
,作为图神经网络模型的最初输入特征,;所述定向消息传递神经网络模块中,在进行消息传递前,先对其初始隐藏层进行初始化计算:其中,τ为ReLU激活函数,W
i
为可学习的矩阵参数,cat(x
v
,e
vw
)是将原子特征与化学键特征合并为相应矩阵;然后在定向消息传递的每一步骤t上,对化合物原子特征的隐藏层和传递信息以及化学键特征的隐藏层和传递信息进行更新;
h
v
=τ(W
a
cat(x
v
,m
v
))然后首先对原子的隐藏层进行求和,获得分子的特征向量h:最终通过进行化合物性质预测,其中f(.)是一个前馈神经网络模块,进而得到预训练好的图神经网络模型。6.根据权利要求5所述的基于深度迁移学习模型的药物分子骨架替换和筛选方法,其特征在于,所述步骤四中...
【专利技术属性】
技术研发人员:余文颖,胡宇轩,张洪浩,任秋翰,马奕柯,吴妍,张震,
申请(专利权)人:中国药科大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。