药物重定位方法、重定位模型的训练方法及装置制造方法及图纸

技术编号:35271881 阅读:19 留言:0更新日期:2022-10-19 10:44
本公开提供了药物重定位方法、重定位模型的训练方法及装置,涉及人工智能技术领域中的深度学习和生物计算技术领域。其中方法为:获取药物分子和细胞组学数据;获取药物分子的第一向量表示和细胞组学数据的第二向量表示;对第一向量表示和第二向量表示进行多头注意力处理,以获取预测向量矩阵,其中,预测向量矩阵用于表征药物分子与细胞组学数据之间的相互作用关系;根据预测向量矩阵和第一向量表示,对药物分子进行重定位。该方法基于多头注意力机制捕获药物分子中子结构与细胞组学数据之间的关系,提高了预测准确度,增强重定位准确度。度。度。

【技术实现步骤摘要】
药物重定位方法、重定位模型的训练方法及装置


[0001]本公开涉及人工智能
中的深度学习和生物计算
,尤其涉及一种药物重定位方法、重定位模型的训练方法及装置。

技术介绍

[0002]药物重定位可应用于针对已存在的药物寻找新的适应症的场景中,在生物医药产业中,药物具有发现困难,审批周期长等特点,如果能够发现已审批药物的新用途则可以缩短审批周期,扩大药企的市场容量同时也造福于患者。目前可以通过预测药物对某一细胞系的组学表征的响应程度(如:IC50值),寻找药物新的潜在适应症,因此如何提高预测准确度,增强药物重定位的准确度成为亟待解决的问题。

技术实现思路

[0003]提供了一种药物重定位方法、重定位模型的训练方法及装置。
[0004]根据第一方面,提供了一种药物重定位方法,包括:获取药物分子和细胞组学数据;获取所述药物分子的第一向量表示和所述细胞组学数据的第二向量表示;对所述第一向量表示和所述第二向量表示进行多头注意力处理,以获取预测向量矩阵,其中,所述预测向量矩阵用于表征所述药物分子与所述细胞组学数据之间的相互作用关系;根据所述预测向量矩阵和所述第一向量表示,对所述药物分子进行重定位。
[0005]根据第二方面,提供了一种基于重定位模型的药物重定位方法,包括:获取药物分子和细胞组学数据,并将所述药物分子和所述细胞组学数据输入训练后的目标重定位模型;由所述目标重定位模型中的编码网络,获取所述药物分子的第一向量表示和所述细胞组学数据的第二向量表示;由所述目标重定位模型中的多头注意力网络,对所述第一向量表示和所述第二向量表示进行多头注意力处理,以获取预测向量矩阵,其中,所述预测向量矩阵用于表征所述药物分子与所述组学数据之间的相互作用关系;由所述目标重定位模型中的预测网络,根据所述预测向量矩阵和所述第一向量表示,对所述药物分子进行重定位。
[0006]根据第三方面,提供了一种重定位模型的训练方法,包括:从训练集中获取同一药物分子和不同细胞系的组学数据对应的样本,以及不同药物分子和同一细胞系的组学数据对应的样本,作为训练样本,其中所述训练集中还包括所述药物分子和所述组学数据之间的响应参数的真实值;根据所述训练样本,对待训练的重定位模型进行训练;根据训练输出的所述响应参数的预测值和所述响应参数的真实值,调整所述重定位模型的模型参数并继续使用下一个训练样本对调整后的重定位模型训练,直至得到训练好的目标重定位模型。
[0007]根据第四方面,提供了一种药物重定位装置,包括:第一获取模块,用于获取药物分子和细胞组学数据;第二获取模块,用于获取所述药物分子的第一向量表示和所述细胞组学数据的第二向量表示;第三获取模块,用于对所述第一向量表示和所述第二向量表示进行多头注意力处理,以获取预测向量矩阵,其中,所述预测向量矩阵用于表征所述药物分子与所述细胞组学数据之间的相互作用关系;预测模块,用于根据所述预测向量矩阵和所
述第一向量表示,对所述药物分子进行重定位。
[0008]根据第五方面,一种基于重定位模型的药物重定位装置,包括:第一获取模块,获取药物分子和细胞组学数据,并将所述药物分子和所述细胞组学数据输入训练后的目标重定位模型;第二获取模块,用于由所述目标重定位模型中的编码网络,获取所述药物分子的第一向量表示和所述细胞组学数据的第二向量表示;第三获取模块,用于由所述目标重定位模型中的多头注意力网络,对所述第一向量表示和所述第二向量表示进行多头注意力处理,以获取预测向量矩阵,其中,所述预测向量矩阵用于表征所述药物分子与所述组学数据之间的相互作用关系;预测模块,用于由所述目标重定位模型中的预测网络,根据所述预测向量矩阵和所述第一向量表示,对所述药物分子进行重定位。
[0009]根据第六方面,提供了一种重定位模型的训练装置,包括:获取模块,用于从训练集中获取同一药物分子和不同细胞系的组学数据对应的样本,以及不同药物分子和同一细胞系的组学数据对应的样本,作为训练样本,其中所述训练集中还包括所述药物分子和所述组学数据之间的响应参数的真实值;训练模块,用于根据所述训练样本,对待训练的重定位模型进行训练;更新模块,用于根据训练输出的所述响应参数的预测值和所述响应参数的真实值,调整所述重定位模型的模型参数并继续使用下一个训练样本对调整后的重定位模型训练,直至得到训练好的目标重定位模型。
[0010]根据第七方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开第一方面所述的药物重定位方法,或者本公开第二方面所述的基于重定位模型的药物重定位方法,或者本公开第三方面所述的重定位模型的训练方法。
[0011]根据第八方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据本公开第一方面所述的药物重定位方法,或者本公开第二方面所述的基于重定位模型的药物重定位方法,或者本公开第三方面所述的重定位模型的训练方法。
[0012]根据第九方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据本公开第一方面所述的药物重定位方法的步骤,或者本公开第二方面所述的基于重定位模型的药物重定位方法的步骤,或者本公开第三方面所述的重定位模型的训练方法的步骤。
[0013]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0014]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0015]图1是根据本公开第一实施例的药物重定位方法的流程示意图;
[0016]图2是根据本公开第二实施例的药物重定位方法的流程示意图;
[0017]图3是根据本公开第三实施例的药物重定位方法的流程示意图;
[0018]图4是根据本公开第四实施例的药物重定位方法的流程示意图;
[0019]图5是根据本公开第五实施例的药物重定位方法的流程示意图;
[0020]图6是根据本公开第一实施例的基于重定位模型的药物重定位方法的流程示意图;
[0021]图7是根据本公开第二实施例的基于重定位模型的药物重定位方法的流程示意图;
[0022]图8是根据本公开实施例的基于重定位模型的药物重定位方法的示例性框图;
[0023]图9是根据本公开第一实施例的重定位模型的训练方法的流程示意图;
[0024]图10是根据本公开实施例的重定位模型的训练方法中的交叉采样示意图;
[0025]图11是根据本公开第二实施例的重定位模型的训练方法的流程示意图;
[0026]图12是对训练好的重定位模型进行效果验证的结果示意图;
[0027]图13是根据本公开第一实施例的药物重定位装置的框图;...

【技术保护点】

【技术特征摘要】
1.一种药物重定位方法,包括:获取药物分子和细胞组学数据;获取所述药物分子的第一向量表示和所述细胞组学数据的第二向量表示;对所述第一向量表示和所述第二向量表示进行多头注意力处理,以获取预测向量矩阵,其中,所述预测向量矩阵用于表征所述药物分子与所述细胞组学数据之间的相互作用关系;根据所述预测向量矩阵和所述第一向量表示,对所述药物分子进行重定位。2.根据权利要求1所述的重定位方法,其中,所述第一向量表示的获取过程,包括:根据所述药物分子的结构信息,生成所述药物分子对应的图,其中,所述图中的节点对应于药物分子中的原子,边对应于药物分子中的化学键;基于图神经网络对所述药物分子对应的图进行编码,以获取所述节点的向量表示作为所述第一向量表示。3.根据权利要求1所述的重定位方法,其中,所述第二向量表示的获取过程,包括:根据所述细胞组学数据中基因之间的关系构建所述细胞组学数据对应的图,其中,所述图中的节点对应于所述基因,所述图中的边用于表征所述基因之间的关系;基于图神经网络对所述细胞组学数据对应的图进行编码,以获取所述细胞组学数据的向量表示;基于多层感知网络对所述细胞组学数据的向量表示进行多层感知处理,以获取所述细胞组学数据的所述第二向量表示。4.根据权利要求1

3中任一项所述的重定位方法,其中,所述对所述第一向量表示和所述第二向量表示进行多头注意力处理,以获取预测向量矩阵,包括:根据所述第一向量表示,确定多头注意力处理对应的查询向量矩阵;根据所述第二向量表示,确定多头注意力处理对应的键向量矩阵和值向量矩阵;根据所述查询向量矩阵、所述键向量矩阵和所述值向量矩阵进行多头注意力处理,以获取所述预测向量矩阵。5.根据权利要求1所述的重定位方法,其中,所述根据所述预测向量矩阵和所述第一向量表示,对所述药物分子进行重定位,包括:对所述药物分子的第一向量表示进行全局池化处理,以生成所述药物分子的向量矩阵;根据所述预测向量矩阵与所述药物分子对应的向量矩阵,获取所述药物分子与所述组学数据之间的响应参数的预测值;根据所述预测值,对所述药物分子进行重定位。6.一种基于重定位模型的药物重定位方法,包括:获取药物分子和细胞组学数据,并将所述药物分子和所述细胞组学数据输入训练后的目标重定位模型;由所述目标重定位模型中的编码网络,获取所述药物分子的第一向量表示和所述细胞组学数据的第二向量表示;由所述目标重定位模型中的多头注意力网络,对所述第一向量表示和所述第二向量表示进行多头注意力处理,以获取预测向量矩阵,其中,所述预测向量矩阵用于表征所述药物
分子与所述组学数据之间的相互作用关系;由所述目标重定位模型中的预测网络,根据所述预测向量矩阵和所述第一向量表示,对所述药物分子进行重定位。7.根据权利要求6所述的重定位方法,其中,由所述目标重定位模型中的编码网络,获取所述药物分子的第一向量表示之前,还包括:根据所述药物分子的结构信息,生成所述药物分子对应的图,其中,所述图中的节点对应于所述药物分子中的原子,边对应于所述药物分子中的化学键。8.根据权利要求7所述的重定位方法,其中,所述编码网络包括图神经网络,所述第一向量表示获取过程,包括:基于所述图神经网络对所述药物分子对应的图进行编码,以获取所述节点的向量表示作为所述第一向量表示。9.根据权利要求6所述的重定位方法,其中,由所述目标重定位模型中的编码网络,获取所述细胞组学数据的第二向量表示之前,还包括:根据所述细胞组学数据中基因之间的关系构建所述细胞组学数据对应的图,其中,所述图中的节点对应于所述基因,所述图中的边用于表征所述基因之间的关系。10.根据权利要求9所述的重定位方法,其中,所述编码网络包括图神经网络和多层感知网络,所述第二向量表示的获取过程,包括:基于图神经网络对所述细胞组学数据对应的图进行编码,以获取所述细胞组学数据的向量表示;基于多层感知网络对所述细胞组学数据的向量表示进行多层感知处理,以获取所述细胞组学数据的所述第二向量表示。11.根据权利要求6所述的重定位方法,其中,所述多头注意力网络包括多个线性层和多个注意力层,所述由所述目标重定位模型中的多头注意力网络,对所述第一向量表示和所述第二向量表示进行多头注意力处理,以获取预测向量矩阵,包括:分别由多个所述线性层根据所述第一向量表示,确定多头注意力处理对应的查询向量矩阵,以及根据所述第二向量表示,确定多头注意力处理对应的键向量矩阵和值向量矩阵;由所述多个注意力层根据所述查询向量矩阵、所述键向量矩阵和所述值向量矩阵进行多头注意力处理,以获取所述预测向量矩阵。12.根据权利要求6所述的重定位方法,其中,所述预测网络包括池化层、拼接层和多层感知层,所述由所述目标重定位模型中的预测网络,根据所述预测向量矩阵和所述第一向量表示,对所述药物分子进行重定位,包括:由所述池化层对所述药物分子的第一向量表示进行全局池化处理,以生成所述药物分子的向量矩阵;由所述拼接层对所述预测向量矩阵和所述药物分子的向量矩阵进行堆叠处理,以生成待处理矩阵;由所述多层感知层,根据所述待处理矩阵,获取所述药物分子与所述组学数据之间的响应参数的预测值,并根据所述预测值,对所述药物分子进行重定位。13.一种重定位模型的训练方法,包括:从训练集中获取同一药物分子和不同细胞系的组学数据对应的样本,以及不同药物分
子和同一细胞系的组学数据对应的样本,作为训练样本,其中所述训练集中还包括所述药物分子和所述组学数据之间的响应参数的真实值;根据所述训练样本,对待训练的重定位模型进行训练;根据所述响应参数的真实值和训练过程中输出的所述响应参数的预测值,调整所述重定位模型的模型参数并继续使用下一个训练样本对调整后的重定位模型训练,直至得到训练好的目标重定位模型。14.根据权利要求13所述的重定位模型的训练方法,其中,所述根据所述响应参数的真实值和训练过程中输出的所述响应参数的预测值,调整所述重定位模型的模型参数,包括:根据所述响应参数的真实值和训练过程中输出的所述响应参数的预测值,确定排序损失函数值和回归损失函数值;根据所述排序损失函数值和所述回归损失函数值,确定所述模型训练的损失函数值;根据所述损失函数值调整所述重定位模型的模型参数。15.根据权利要求14所述的训练...

【专利技术属性】
技术研发人员:郜杰赵国栋方晓敏王凡何径舟
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1