药物-靶蛋白亲和力预测方法及系统技术方案

技术编号：31508387 阅读：90 留言：0更新日期：2021-12-22 23:43

本发明专利技术提供一种药物

全部详细技术资料下载

【技术实现步骤摘要】
药物
‑
靶蛋白亲和力预测方法及系统

[0001]本专利技术涉及基于人工智能的生物信息处理
，具体涉及一种基于任务自适应元学习神经网络的药物
‑
靶蛋白亲和力预测方法及系统。

技术介绍

[0002]药物
‑
靶蛋白亲和力又称药物
‑
靶蛋白相互作用，反映药物分子和特定靶蛋白之间的结合强度，其预测结果在新药发现、药物重定位和药物副作用预测中具有重要作用。
[0003]传统的基于实验室的药物
‑
靶蛋白亲和力预测方法成本高且效率低，不适应于处理大量的药物化学分子和靶蛋白分子。近年来，基于机器学习的方法加快了药物
‑
靶蛋白亲和力预测进度，并在学术界和工业界都得到了越来越多的关注。
[0004]根据药物化学分子和靶蛋白分子在训练集和测试集中的出现情况，药物
‑
靶蛋白亲和力预测可以划分为四种情况：(1)热启动：测试集中的药物化学分子和靶蛋白分子均出现在训练集中；(2)药物冷启动：测试集中的靶蛋白分子出现在训练集中，但药物化学分子未出现在训练集中；(3)靶蛋白冷启动：测试集中的药物化学分子出现在训练集中，但靶蛋白分子未出现在训练集中；(4)药物
‑
靶蛋白冷启动：测试集中的药物化学分子和靶蛋白分子均未出现在训练集中。
[0005]现有的基于机器学习进行药物
‑
靶蛋白亲和力预测的方法，大多数利用药物和靶蛋白两种信息预测药物
‑
靶蛋白亲和

【技术保护点】

【技术特征摘要】
1.一种药物
‑
靶蛋白亲和力预测方法，其特征在于，包括：对待检测的药物
‑
靶蛋白对中的药物化学分子和靶蛋白分子分别进行编码，得到药物输入表示和靶蛋白输入表示；利用药物
‑
靶蛋白亲和力预测模型对所述药物输入表示和靶蛋白输入表示进行处理，得到药物
‑
靶蛋白亲和力预测值；其中，所述药物
‑
靶蛋白亲和力预测模型利用训练集训练得到，所述训练集包括多个药物
‑
靶蛋白对以及标注每个药物
‑
靶蛋白对中的药物和靶蛋白亲和力的真实值的标签。2.根据权利要求1所述的药物
‑
靶蛋白亲和力预测方法，其特征在于，利用训练集训练得到所述药物
‑
靶蛋白亲和力预测模型包括：定义预测子任务；其中，预测子任务为预测以一个药物为核心结合不同的靶蛋白的药物
‑
靶蛋白亲和力或预测以一个靶蛋白为核心结合不同药物的药物
‑
靶蛋白亲和力；获得对应的定义的子任务的药物
‑
靶蛋白对中药物输入表示和靶蛋白输入表示，输入至任务自适应元学习神经网络进行训练，得到任务自适应元学习神经网络预训练模型；优化任务自适应元学习神经网络预训练模型，得到药物
‑
靶蛋白亲和力预测模型。3.根据权利要求2所述的药物
‑
靶蛋白亲和力预测方法，其特征在于，根据药物化学分子表示字典对药物化学分子进行编码得到药物输入表示；其中，药物化学分子的表示为简化分子线性输入规范，药物化学分子表示字典是多个无重复ASCII码，每个所述ASCII码对应一个自然数；根据药物化学分子表示字典将简化分子线性输入规范转换为数值序列，并将该序列长度固定；根据靶蛋白分子表示字典对靶蛋白分子进行编码得到靶蛋白输入表示；其中，靶蛋白分子表示为蛋白序列，靶蛋白分子表示字典是多个无重复字符，每个所述字符对应一个自然数；根据靶蛋白分子表示字典将蛋白序列转换为数值序列，并将该序列长度固定。4.根据权利要求3所述的药物
‑
靶蛋白亲和力预测方法，其特征在于，所述任务自适应元学习神经网络包括药物嵌入层、靶蛋白嵌入层、药物编码模块、靶蛋白编码模块、特征融合层和预测模块；其中，所述药物编码网络和靶蛋白编码网络均包括三个一维卷积层，第三个一维卷积层后均连接一个最大池化层；所述预测模块包括四个全连接层；药物编码模块和靶蛋白编码模块中每一个一维卷积层的输出经过泄露修正线性单元激活；预测模块中前三个全连接层的输出经过泄露修正线性单元激活。5.根据权利要求4所述的药物
‑
靶蛋白亲和力预测方法，其特征在于，得到任务自适应元学习神经网络预训练模型包括：随机采样预测子任务数据集，其中每个预测子任务数据集中均包括支撑集和查询集，支撑集和查询集中的每一个样本均包...

【专利技术属性】
技术研发人员：汲化，李梅，徐思涵，蔡祥睿，
申请(专利权)人：南开大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人