【技术实现步骤摘要】
一种多模态药物
‑
蛋白质靶点相互作用预测方法及系统
[0001]本专利技术属于生物基因和人工智能药物研究
,尤其涉及一种多模态药物
‑
蛋白质靶点相互作用预测方法及系统。
技术介绍
[0002]在药物研发过程中,一款新药的研发一般需要经历临床前研发和临床试验两个阶段,其中在临床前研发阶段又需要经历苗头化合物(Hit)发现、先导化合物(Lead)优化和药效试验等过程,通过在研发早期通过预测方式快速发现潜在药物
‑
蛋白质靶点相互作用(Drug Protein Interactions,DPIs),从而显著缩小潜在药物分子的搜索空间,实现高效准确的药物研发流程。随着医药数据的不断积累,使用基于数据驱动的机器学习方法预测DPI受到了越来越多的关注,较于传统的基于药化专家经验或实验室测定来发现有效化合物的方法,使用机器学习方法预测药物
‑
蛋白质靶点相互作用关系能够对海量化合物进行高通量筛选,进而在早期发现具有较高活性和价值的候选化合物。目前基于机器学习的DPI预测方法主要可以分为基于相似度/距离的方法、基于特征的方法和基于深度学习的方法,其中基于深度学习的方法能够利用深度学习方法强大的特征提取和学习能力有效的挖掘大规模药化数据中存在的潜在关联,从而为DPI的准确预测提供了坚实的基础。
[0003]DPI预测主要由药物分子和蛋白质靶点的特征表示和特征交互两部分组成。通常情况下,药物分子可由一维SMILES序列进行表示,也可由二维的分子图结构进行描 ...
【技术保护点】
【技术特征摘要】
1.一种多模态药物
‑
蛋白质靶点相互作用预测方法,其特征在于,包括:S1,对药物分子进行特征编码从而获取药物分子的特征表示;S2,对蛋白质靶点进行特征编码从而获取蛋白质靶点的特征表示;S3,将所述多模态药物分子的特征表示和所述多模态蛋白质靶点的特征表示进行特征融合获得融合后的相互作用特征;S4,将融合后的相互作用特征作为分类器的输入,基于带标签训练集对预测模型进行训练后获得相互作用预测模型,从而基于所述相互作用预测模型预测药物分子和蛋白质靶点之间的相互作用。2.根据权利要求1所述的一种多模态药物
‑
蛋白质靶点相互作用预测方法,其特征在于,所述S1包括:S11,利用RDKit工具将分子的SMILES序列表示转换为图结构表示,并基于图结构表示得到相应的分子图特征;S12,将分子图特征作为输入,通过图神经网络编码得到药物分子的结构特征;S13,将分子的SMILES序列作为输入,通过第一预训练模型得到药物分子的语义特征;S14,将所述药物分子的结构特征和所述药物分子的语义特征进行整合编码,得到相应的多模态药物分子的特征表示。3.根据权利要求2所述的一种多模态药物
‑
蛋白质靶点相互作用预测方法,其特征在于,所述第一预训练模型为预训练Mol2vec模型。4.根据权利要求3所述的一种多模态药物
‑
蛋白质靶点相互作用预测方法,其特征在于,所述S2包括:S21,基于蛋白质靶点的预测氨基酸亲和度矩阵和基于氨基酸序列匹配的特征向量构建蛋白质图,所述蛋白质图的结构特征表征蛋白质中氨基酸残基之间的空间结构关系;S22,将蛋白图特征作为输入,通过图神经网络和卷积神经网络编码得到蛋白质靶点的结构特征;S23,将所述蛋白质靶点的一维氨基酸序列作为输入,通过第二预训练模型得到蛋白质靶点的语义特征;S24,将所述蛋白质靶点的结构特征和所述蛋白质靶点的语义特征进行整合编码,得到相应的多模态蛋白质靶点的特征表示。5.根据权利要求4所述的一种多模态药物
‑
蛋白质靶点相互作用预测方法,其特征在于,所述第二预训练模型为预训练BERT模型。6.根据权利要求5所述的一种多模态药物
‑
蛋白...
【专利技术属性】
技术研发人员:王鹏磊,柳俊宏,刘勇,李欣泽,
申请(专利权)人:星希尔生物科技上海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。