【技术实现步骤摘要】
先导化合物活性优化方法
[0001]本专利技术涉及一种先导化合物活性优化方法。
技术介绍
[0002]计算机辅助先导化合物活性优化技术是指利用计算机算法提高靶点和先导化合物结合亲和力的方法。通常,药物化学家会根据他们的直觉对初始分子进行分子优化。一种广泛使用的策略是采用匹配分子对(Matched Molecular Pair,以下简称MMP)的概念,即药化专家会对保持初始分子母核部分(scaffold)不变,同时替换另一部分结构基团(R基团),以获得所需的活性。
[0003]传统计算机辅助药物设计(以下简称CADD)方法是通过R基团和scaffold的构效关系(以下简称SAR)实现先导优化过程。一般而言,SAR算法中的R基团替换是基于专家经验知识实现。然而,R基团替换的专家知识库非常庞大,受到人脑经验和后期维护成本的限制,先导优化技术有待发展。
[0004]越来越多的研究表明,新一代的人工智能(Artificial Intelligence,以下简称AI)技术能够提升先导优化性能指标。然而,现有AI方法主要通 ...
【技术保护点】
【技术特征摘要】
1.一种先导化合物活性优化方法,其特征在于,包含以下步骤:获取PDB数据库,抽取蛋白质靶标target和小分子配体ligand的共晶结构,从BindingDB数据库中找到对应的活性值pAC50,按活性值pAC50制作三元组(target,ligand,pAC50)格式的数据集;从三元组中选择pAC50值大于预设值的小分子配体ligand,用docking软件逐个完成target和ligand的打分,即ppAC50值,形成(target_FASTA,ligand,pAC50,ppAC50)四元组,target_FASTA是指蛋白质靶标target的完整氨基酸序列;逐个为四元组中的小分子配体ligand断裂出初始分子母核scaffold和R基团true_R_goup,生成新的R基团fake_R_goup拼接到初始分子母核scaffold的断裂处;将新的R基团fake_R_goup和初始分子母核scaffold进行拼接产生新的小分子配体ligand,用docking软件进行打分,即pppAC50,如果pppAC50小于ppAC50,则将这些新数据构造出(target_FASTA,ligand,pAC50,ppAC50,pppAC50,scaffold,fake_R_goup,true_R_group)八元组;从八元组中提取出初始分子母核scaffold和新的R基团fake_R_goup作为训练数据,对应的R基团true_R_goup则作为训练集中的标签数据,获得(scaffold,fake_R_group,true_R_goup)MMP训练集;通过MMP训练集对Transformer模型进行训练。2.根据权利要求1所述的先导化合物活性优化方法,其特征在于,通过MMP训练集对Transformer模型进行训练的具体方法为:获取MMP训练集中的初始分子母核scaffold和新的R基团fake_R_goup的隐空间向量H;将获取到的隐空间向量H输入Transformer模型的编码模块进行编码得到隐向量L;获取PDB数据库中的蛋白质序列的特征向量P;将隐向量L和特征向量P进行注意力加权操作得到隐向量C;将隐向量C输入Transformer模型的解码模块进行解码生成预测的R基团R_group;通过预测的R基团R_group和R基团true_R_goup计算LOSS...
【专利技术属性】
技术研发人员:居斌,孙楠楠,钱小亮,
申请(专利权)人:杭州生奥信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。