【技术实现步骤摘要】
一种基于深度学习算法的DTI预测方法
[0001]本专利技术涉及DTI预测领域,尤其为一种基于深度学习算法的DTI预测方法。
技术介绍
[0002]深度学习是机器学习的一个分支,其基于不同种人工神经网络算法,该算法通过一系列具有非线性处理节点的层来学习数据中抽象的特征。在训练深度学习模型时每层的输入是基于上一层输出的特征。随着神经网络的层数的增加,节点可以识别出更加复杂的特征,因为神经网络会聚合和重组上一层的特征,目前,深度学习算法已应用在预测化合物性质、化学合成、预测DTI等方面,栈式自编码网络(Stacked AutoEncoder,SAE)、卷积神经网络、循环神经网络、图神经网络(Graph Neural Network,GNN)在从药物分子和靶点蛋白特征中提取特征方面具有较好的表现,从而增加预测DTI的准确性。
技术实现思路
[0003]本专利技术提供了非端到端模型DeepSAE,充分学习无标签数据,对输入变量进行降维并从中提取对预测结果有用的变量,减小模型的计算量,且SAE相比于其他的无监督的降维方 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度学习算法的DTI预测方法,其特征在于:利用Python软件分别处理药物分子和靶点蛋白序列数据,将通过SMILES字符和靶点蛋白序列得到的药物分子指纹和靶点蛋白描述符作为模型输入,经过两个SAE对药物分子描述符和靶点蛋白序列数据进行特征提取,获得相同维度的药物与靶点蛋白的深度表征,将SAE提取得到的特征向量嵌入FCNN,从而对DTI进行推断。2.根据权利要求1所述的一种基于深度学习算法的DTI预测方法,其特征在于:SAE包括输入层、隐藏层和输出重构层,SAE的输入层和隐藏层构成编码器,SAE隐藏层和输出重构层构成解码器。3.根据权利要求1所述的一种基于深度学习算法的DTI预测方法,其特征在于:数据处理包括以下步骤:步骤一:从DrugBank、PubChem、ChEMBL、BindingDB、BRENDA、KEGG BRITE数据库中获取药物分子SMILES,从Uniprot中获取靶点蛋白序列;步骤二:通过基于Python开发的化学软件包RDKit将药物分子SMILES转换成2048位的ECFP4和166位的MACCS两种分子指纹,X
D
代表2214位药物分子指纹输入变量;步骤三:使用Python软件包将靶点蛋白序列转化成8420位PSC和147位的CTD两种描述符,使用PSI
‑
BLAST将靶点蛋白转换成相应的P...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。