【技术实现步骤摘要】
一种化合物
‑
靶蛋白绑定关系预测方法及系统
[0001]本专利技术涉及医药研发
,特别是涉及一种化合物
‑
靶蛋白绑定关系预测方法及系统。
技术介绍
[0002]利用现在已有的主流深度学习模型(ANN,CNN,DNN、RNN、LSTM、Transformer以及GAN等),抽取化合物
‑
靶蛋白绑定关系的特征,从而预测新的化合物
‑
靶蛋白绑定关系,对于新药发现/研发和中药作用机理的研究具有重要的现实意义。然而,尽管这些模型可以达到很高的正确率(>90%),但是高企的假阳性率阻止了深度学习模型在该领域的进一步应用。但是,如何进一步降低化合物
‑
靶蛋白绑定关系预测的假阳性率,到目前为止仍是一个世界级的问题。
技术实现思路
[0003]本专利技术的目的是提供一种化合物
‑
靶蛋白绑定关系预测方法及系统,能够降低化合物
‑
靶蛋白绑定关系预测的假阳性率。
[0004]为实现 ...
【技术保护点】
【技术特征摘要】
1.一种化合物
‑
靶蛋白绑定关系预测方法,其特征在于,所述方法包括:获取多对靶蛋白
‑
化合物绑定数据,并将靶蛋白
‑
化合物绑定关系作为标签构建原始样本数据;每对靶蛋白
‑
化合物绑定数据包括化合物原子信息、化合物化学键信息以及靶蛋白序列信息;根据各所述化合物原子信息、化合物化学键信息进行化合物相似度计算,确定化合物相似度,并基于所述化合物相似度对所述原始样本数据进行分类,得到若干组靶蛋白
‑
化合物绑定数据;构建深度学习网络模型,分别采用每组靶蛋白
‑
化合物绑定数据对所述深度学习网络模型进行训练,得到多组靶蛋白
‑
化合物绑定关系预测模型;根据待测数据与原始样本数据的化合物相似度,确定所述待测数据对应的靶蛋白
‑
化合物绑定关系预测模型;所述待测数据包括待测化合物和待测靶蛋白数据;通过对应的靶蛋白
‑
化合物绑定关系预测模型对所述待测化合物与所述待测靶蛋白的绑定关系进行预测。2.根据权利要求1所述的化合物
‑
靶蛋白绑定关系预测方法,其特征在于,所述“基于所述化合物相似度对所述原始样本数据进行分类,得到若干组靶蛋白
‑
化合物绑定数据”,具体包括:选取任意一对靶蛋白
‑
化合物绑定数据作为目标绑定数据;遍历原始样本数据,将与所述目标绑定数据的化合物相似度大于设定阈值的靶蛋白
‑
化合物绑定数据划分为一组。3.根据权利要求1所述的化合物
‑
靶蛋白绑定关系预测方法,其特征在于,所述深度学习网络模型包括长短时记忆网络模块、自注意力学习模块、全连接模块和二分类输出模块;所述长短时记忆网络模块包括3个长短时记忆网络层。4.根据权利要求1所述的化合物
‑
靶蛋白绑定关系预测方法,其特征在于,所述深度学习网络模型包括长短时记忆网络模块、自注意力学习模块、全连接模块和二分类输出模块...
【专利技术属性】
技术研发人员:郑光,吕诚,石亚蓉,陆小虎,茹佳奇,赵君梅,李立,赵宁,
申请(专利权)人:兰州大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。