药物重定位方法、重定位模型的训练方法及装置制造方法及图纸

技术编号：35271881 阅读：19 留言：0更新日期：2022-10-19 10:44

本公开提供了药物重定位方法、重定位模型的训练方法及装置，涉及人工智能技术领域中的深度学习和生物计算技术领域。其中方法为：获取药物分子和细胞组学数据；获取药物分子的第一向量表示和细胞组学数据的第二向量表示；对第一向量表示和第二向量表示进行多头注意力处理，以获取预测向量矩阵，其中，预测向量矩阵用于表征药物分子与细胞组学数据之间的相互作用关系；根据预测向量矩阵和第一向量表示，对药物分子进行重定位。该方法基于多头注意力机制捕获药物分子中子结构与细胞组学数据之间的关系，提高了预测准确度，增强重定位准确度。度。度。

全部详细技术资料下载

【技术实现步骤摘要】
药物重定位方法、重定位模型的训练方法及装置

[0001]本公开涉及人工智能
中的深度学习和生物计算
，尤其涉及一种药物重定位方法、重定位模型的训练方法及装置。

技术介绍

[0002]药物重定位可应用于针对已存在的药物寻找新的适应症的场景中，在生物医药产业中，药物具有发现困难，审批周期长等特点，如果能够发现已审批药物的新用途则可以缩短审批周期，扩大药企的市场容量同时也造福于患者。目前可以通过预测药物对某一细胞系的组学表征的响应程度(如：IC50值)，寻找药物新的潜在适应症，因此如何提高预测准确度，增强药物重定位的准确度成为亟待解决的问题。

技术实现思路

[0003]提供了一种药物重定位方法、重定位模型的训练方法及装置。
[0004]根据第一方面，提供了一种药物重定位方法，包括：获取药物分子和细胞组学数据；获取所述药物分子的第一向量表示和所述细胞组学数据的第二向量表示；对所述第一向量表示和所述第二向量表示进行多头注意力处理，以获取预测向量矩阵，其中，所述预测向量矩阵用于表征所述药物分子与所述细胞组学数据之间的相互作用关系；根据所述预测向量矩阵和所述第一向量表示，对所述药物分子进行重定位。
[0005]根据第二方面，提供了一种基于重定位模型的药物重定位方法，包括：获取药物分子和细胞组学数据，并将所述药物分子和所述细胞组学数据输入训练后的目标重定位模型；由所述目标重定位模型中的编码网络，获取所述药物分子的第一向量表示和所述细胞组学数据的第二向量表示；由所述目标重定位模型中的多头注意

【技术保护点】

【技术特征摘要】
1.一种药物重定位方法，包括：获取药物分子和细胞组学数据；获取所述药物分子的第一向量表示和所述细胞组学数据的第二向量表示；对所述第一向量表示和所述第二向量表示进行多头注意力处理，以获取预测向量矩阵，其中，所述预测向量矩阵用于表征所述药物分子与所述细胞组学数据之间的相互作用关系；根据所述预测向量矩阵和所述第一向量表示，对所述药物分子进行重定位。2.根据权利要求1所述的重定位方法，其中，所述第一向量表示的获取过程，包括：根据所述药物分子的结构信息，生成所述药物分子对应的图，其中，所述图中的节点对应于药物分子中的原子，边对应于药物分子中的化学键；基于图神经网络对所述药物分子对应的图进行编码，以获取所述节点的向量表示作为所述第一向量表示。3.根据权利要求1所述的重定位方法，其中，所述第二向量表示的获取过程，包括：根据所述细胞组学数据中基因之间的关系构建所述细胞组学数据对应的图，其中，所述图中的节点对应于所述基因，所述图中的边用于表征所述基因之间的关系；基于图神经网络对所述细胞组学数据对应的图进行编码，以获取所述细胞组学数据的向量表示；基于多层感知网络对所述细胞组学数据的向量表示进行多层感知处理，以获取所述细胞组学数据的所述第二向量表示。4.根据权利要求1
‑
3中任一项所述的重定位方法，其中，所述对所述第一向量表示和所述第二向量表示进行多头注意力处理，以获取预测向量矩阵，包括：根据所述第一向量表示，确定多头注意力处理对应的查询向量矩阵；根据所述第二向量表示，确定多头注意力处理对应的键向量矩阵和值向量矩阵；根据所述查询向量矩阵、所述键向量矩阵和所述值向量矩阵进行多头注意力处理，以获取所述预测向量矩阵。5.根据权利要求1所述的重定位方法，其中，所述根据所述预测向量矩阵和所述第一向量表示，对所述药物分子进行重定位，包括：对所述药物分子的第一向量表示进行全局池化处理，以生成所述药物分子的向量矩阵；根据所述预测向量矩阵与所述药物分子对应的向量矩阵，获取所述药物分子与所述组学数据之间的响应参数的预测值；根据所述预测值，对所述药物分子进行重定位。6.一种基于重定位模型的药物重定位方法，包括：获取药物分子和细胞组学数据，并将所述药物分子和所述细胞组学数据输入训练后的目标重定位模型；由所述目标重定位模型中的编码网络，获取所述药物分子的第一向量表示和所述细胞组学数据的第二向量表示；由所述目标重定位模型中的多头注意力网络，对所述第一向量表示和所述第二向量表示进行多头注意力处理，以获取预测向量矩阵，其中，所述预测向量矩阵用于表征所述药物
分子与所述组学数据之间的相互作用关系；由所述目标重定位模型中的预测网络，根据所述预测向量矩阵和所述第一向量表示，对所述药物分子进行重定位。7.根据权利要求6所述的重定位方法，其中，由所述目标重定位模型中的编码网络，获取所述药物分子的第一向量表示之前，还包括：根据所述药物分子的结构信息，生成所述药物分子对应的图，其中，所述图中的节点对应于所述药物分子中的原子，边对应于所述药物分子中的化学键。8.根据权利要求7所述的重定位方法，其中，所述编码网络包括图神经网络，所述第一向量表示获取过程，包括：基于所述图神经网络对所述药物分子对应的图进行编码，以获取所述节点的向量表示作为所述第一向量表示。9.根据权利要求6所述的重定位方法，其中，由所述目标重定位模型中的编码网络，获取所述细胞组学数据的第二向量表示之前，还包括：根据所述细胞组学数据中基因之间的关系构建所述细胞组学数据对应的图，其中，所述图中的节点对应于所述基因，所述图中的边用于表征所述基因之间的关系。10.根据权利要求9所述的重定位方法，其中，所述编码网络包括图神经网络和多层感知网络，所述第二向量表示的获取过程，包括：基于图神经网络对所述细胞组学数据对应的图进行编码，以获取所述细胞组学数据的向量表示；基于多层感知网络对所述细胞组学数据的向量表示进行多层感知处理，以获取所述细胞组学数据的所述第二向量表示。11.根据权利要求6所述的重定位方法，其中，所述多头注意力网络包括多个线性层和多个注意力层，所述由所述目标重定位模型中的多头注意力网络，对所述第一向量表示和所述第二向量表示进行多头注意力处理，以获取预测向量矩阵，包括：分别由多个所述线性层根据所述第一向量表示，确定多头注意力处理对应的查询向量矩阵，以及根据所述第二向量表示，确定多头注意力处理对应的键向量矩阵和值向量矩阵；由所述多个注意力层根据所述查询向量矩阵、所述键向量矩阵和所述值向量矩阵进行多头注意力处理，以获取所述预测向量矩阵。12.根据权利要求6所述的重定位方法，其中，所述预测网络包括池化层、拼接层和多层感知层，所述由所述目标重定位模型中的预测网络，根据所述预测向量矩阵和所述第一向量表示，对所述药物分子进行重定位，包括：由所述池化层对所述药物分子的第一向量表示进行全局池化处理，以生成所述药物分子的向量矩阵；由所述拼接层对所述预测向量矩阵和所述药物分子的向量矩阵进行堆叠处理，以生成待处理矩阵；由所述多层感知层，根据所述待处理矩阵，获取所述药物分子与所述组学数据之间的响应参数的预测值，并根据所述预测值，对所述药物分子进行重定位。13.一种重定位模型的训练方法，包括：从训练集中获取同一药物分子和不同细胞系的组学数据对应的样本，以及不同药物分
子和同一细胞系的组学数据对应的样本，作为训练样本，其中所述训练集中还包括所述药物分子和所述组学数据之间的响应参数的真实值；根据所述训练样本，对待训练的重定位模型进行训练；根据所述响应参数的真实值和训练过程中输出的所述响应参数的预测值，调整所述重定位模型的模型参数并继续使用下一个训练样本对调整后的重定位模型训练，直至得到训练好的目标重定位模型。14.根据权利要求13所述的重定位模型的训练方法，其中，所述根据所述响应参数的真实值和训练过程中输出的所述响应参数的预测值，调整所述重定位模型的模型参数，包括：根据所述响应参数的真实值和训练过程中输出的所述响应参数的预测值，确定排序损失函数值和回归损失函数值；根据所述排序损失函数值和所述回归损失函数值，确定所述模型训练的损失函数值；根据所述损失函数值调整所述重定位模型的模型参数。15.根据权利要求14所述的训练...

【专利技术属性】
技术研发人员：郜杰，赵国栋，方晓敏，王凡，何径舟，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人