当前位置: 首页 > 专利查询>浙江大学专利>正文

基于协同注意力的可解释性抗癌药物协同预测方法及装置制造方法及图纸

技术编号:39828648 阅读:5 留言:0更新日期:2023-12-29 16:05
本发明专利技术公开了一种基于协同注意力的可解释性抗癌药物协同预测方法和装置,包括:获取细胞系的多组学数据

【技术实现步骤摘要】
基于协同注意力的可解释性抗癌药物协同预测方法及装置


[0001]本专利技术属于药物组合预测与评价
,具体涉及一种基于协同注意力的可解释性抗癌药物协同预测方法及装置


技术介绍

[0002]癌症是全球性的重大难治性疾病,药物治疗是癌症治疗的最主要方式之一

目前,抗肿瘤药物的飞速发展为患者治疗提供了更多的用药选择,同时推动了药物组合治疗的发展

药物合用策略已经被证明是一种有效的癌症治疗策略,可以提高治疗效果并且降低患者的毒副作用

但目前药物合用的发现主要是依赖临床经验和实验筛选,效率低且成本极高;同时,由于癌症的多重异质性和药物作用的多样性,仅依靠人为经验无法全面考虑药物之间的相互作用

因此,开发一种高效且智能化的药物组合发现策略,具有重要的科学意义和临床价值

[0003]近些年来,医药大数据和深度学习技术的发展为解决这一问题提供了新的机会

一方面,伴随测序技术
、CRISPR
等高通量实验技术的发展,诞生了一系列癌症相关的数据库

比如,癌症细胞系组学数据库
(Cancer Cell Line Encyclopedia

CCLE)、
癌症基因组图谱
(The Cancer Genome Atlas,TCGA)
等数据库收录了大量癌症细胞系和癌症患者个体的多组学数据,提供了用以描述肿瘤分子特征的数据资源;药物合用领域也有多个大型的药物合用筛选数据库,比例如
DrugComb、DrugCombDB、SYNERGxDB
等,这些数据库收录了数千个药物在三百余个细胞系上的近百万条合用信息,为人工智能技术在合用问题上的应用提供了数据基础

[0004]另一方面,深度学习作为一种强大的人工智能技术,已经在图像识别

自然语言处理和数据分析等许多领域展示出了巨大的潜力

在癌症领域,深度学习也已经被广泛地用于肿瘤诊断

药物开发

个性化医疗等方面的研究

目前,深度学习方法多被用于预测单个药物对疾病的响应,但针对药物合用预测的研究还相对较少

大致有以下两类模型构建方法,一种方法侧重于用两个分支分别提取药物和细胞系的特征,经过简单的特征拼接后进行协同预测,如公开号为
CN111223577A
的专利所描述的方法,但此类方法由于没有考虑药物间相互作用和药物

靶标间的相互作用等重要信息,预测准确性不足;另一种方法是将基因和药物分子分别作为节点编码为一张异构图,通过提取不同节点之间的关联来预测药物协同,如公开号为
CN114420309A
的专利所申请的方法,但此类方法由于过度依赖已知的药物

药物关联和已知的药物

靶标关联先验信息,限制了其在全新药物预测或全新细胞系预测上的推理能力


技术实现思路

[0005]鉴于上述,本专利技术的目的是提供一种基于协同注意力的可解释性抗癌药物协同预测方法及装置,基于子结构编码充分考虑药物的化学信息,整合多组学数据提取细胞系的个体特征,同时基于协同注意力机制实现对药物

药物相互作用

药物

细胞系相互作用的
可解释性编码和预测,从而实现了对肿瘤药物合用的更高效

智能化预测

[0006]为实现上述专利技术目的,实施例提供了一种基于协同注意力的可解释性抗癌药物协同预测方法,包括以下步骤:
[0007]获取细胞系的多组学数据

至少2种药物数据

药物组合在不同细胞系上的合用指数数据;
[0008]构建每种药物数据的结构特征

多组学数据的嵌入特征;
[0009]构建药物组合预测模型,包括每种药物数据对应的一个药物

细胞系关联特征提取模块和一个药物

药物关联特征提取模块

药物合用指数预测模块,每个药物

细胞系关联特征提取模块用于基于协同注意力对每种药物数据的结构特征和多组学数据的嵌入特征进行关联特征提取得到药物特异性的细胞系特征和细胞系特异性的药物特征,拼接所有种药物数据对应的药物特异性的细胞系特征得到最终细胞系特征;每个药物

药物关联特征提取模块用于基于协同注意力对每个药物数据的结构特征与其他药物数据的结构特征进行关联特征提取得到融合其他药物信息的药物特征,拼接细胞系特异性的药物特征与融合其他药物信息的药物特征作为每种药物数据的最终药物特征;药物合用指数预测模块用于基于所有药物数据的最终药物特征和最终细胞系特征预测药物合用指数;
[0010]以细胞系的多组学数据

药物数据作为样本数据,以药物组合在不同细胞系上的合用指数数据作为真值标签,对药物组合预测模型进行参数优化;
[0011]利用参数优化后的药物组合预测模型进行药物组合预测

[0012]优选地,所述药物组合预测模型中,所述药物组合预测模型中,每种药物数据对应的药物

药物关联特征提取模块的输入端与该种药物数据对应的药物

细胞系关联特征提取模块的输出端连接,此时,每个药物

药物关联特征提取模块用于基于协同注意力对该种药物数据对应的细胞系特异性的药物特征和其他种药物数据的结构特征进行关联特征提取得到融合细胞系特异性和其他药物信息的药物特征作为最终药物特征

[0013]优选地,所述药物组合预测模型中,每种药物数据对应的药物

细胞系关联特征提取模块的输入端与该种药物数据对应的药物

药物关联特征提取模块的输出端连接,此时,每个药物

细胞系关联特征提取模块用于基于协同注意力对每种药物数据对应的融合其他药物信息的药物特征和多组学数据的嵌入特征进行关联特征提取得到多药物特异性的细胞系特征和细胞系特异性的多药物特征作为最终药物特征,拼接所有种药物数据对应的多药物特异性的细胞系特征得到最终细胞系特征

[0014]优选地,每个药物

细胞系关联特征提取模块包括第一多头协同注意力网络和第三前馈神经网络,在第一多头协同注意力网络中依据第一输入矩阵生成
Query
矩阵,第二输入矩阵生成
Key
矩阵和
Value
矩阵,
Query
矩阵和
Key
矩阵的转置矩阵进行点乘运算得到注意力矩阵,再以点乘的方式将注意力矩阵作为权重对
Value
矩阵进行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于协同注意力的可解释性抗癌药物协同预测方法,其特征在于,包括以下步骤:获取细胞系的多组学数据

至少2种药物数据

药物组合在不同细胞系上的合用指数数据;构建每种药物数据的结构特征

多组学数据的嵌入特征;构建药物组合预测模型,包括每种药物数据对应的一个药物

细胞系关联特征提取模块和一个药物

药物关联特征提取模块

药物合用指数预测模块,每个药物

细胞系关联特征提取模块用于基于协同注意力对每种药物数据的结构特征和多组学数据的嵌入特征进行关联特征提取得到药物特异性的细胞系特征和细胞系特异性的药物特征,拼接所有种药物数据对应的药物特异性的细胞系特征得到最终细胞系特征;每个药物

药物关联特征提取模块用于基于协同注意力对每个药物数据的结构特征与其他药物数据的结构特征进行关联特征提取得到融合其他药物信息的药物特征,拼接细胞系特异性的药物特征与融合其他药物信息的药物特征作为每种药物数据的最终药物特征;药物合用指数预测模块用于基于所有药物数据的最终药物特征和最终细胞系特征预测药物合用指数;以细胞系的多组学数据

药物数据作为样本数据,以药物组合在不同细胞系上的合用指数数据作为真值标签,对药物组合预测模型进行参数优化;利用参数优化后的药物组合预测模型进行药物组合预测
。2.
根据权利要求1所述的基于协同注意力的可解释性抗癌药物协同预测方法,其特征在于,还包括:所述药物组合预测模型中,每种药物数据对应的药物

药物关联特征提取模块的输入端与该种药物数据对应的药物

细胞系关联特征提取模块的输出端连接,此时,每个药物

药物关联特征提取模块用于基于协同注意力对该种药物数据对应的细胞系特异性的药物特征和其他种药物数据的结构特征进行关联特征提取得到融合细胞系特异性和其他药物信息的药物特征作为最终药物特征
。3.
根据权利要求1所述的基于协同注意力的可解释性抗癌药物协同预测方法,其特征在于,还包括:所述药物组合预测模型中,每种药物数据对应的药物

细胞系关联特征提取模块的输入端与该种药物数据对应的药物

药物关联特征提取模块的输出端连接,此时,每个药物

细胞系关联特征提取模块用于基于协同注意力对每种药物数据对应的融合其他药物信息的药物特征和多组学数据的嵌入特征进行关联特征提取得到多药物特异性的细胞系特征和细胞系特异性的多药物特征作为最终药物特征,拼接所有种药物数据对应的多药物特异性的细胞系特征得到最终细胞系特征
。4.
根据权利要求1或2或3所述的基于协同注意力的可解释性抗癌药物协同预测方法,其特征在于,每个药物

细胞系关联特征提取模块包括第一多头协同注意力网络和第三前馈神经网络,在第一多头协同注意力网络中依据第一输入矩阵生成
Query
矩阵,第二输入矩阵生成
Key
矩阵和
Value
矩阵,
Query
矩阵和
Key
矩阵的转置矩阵进行点乘运算得到注意力矩阵,再以点乘的方式将注意力矩阵作为权重对
Value
矩阵进行加权得到输出矩阵,第一头协同注意力网络的输出矩阵经过残差连接和层归一化输入至第三前馈神经网络进行非线性变换,以增强特征;当第一输入矩阵为药物数据的结构特征,第二输入矩阵为多组学数据的嵌入特征时,输出矩阵为药物特异性的细胞系特征;
当第一输入矩阵为多组学数据的嵌入特征,第二输入矩阵为药物数据的结构特征时,输出矩阵为细胞系特异性的药物特征;当第一输入矩阵为融合其他药物信息的药物特征,第二输入矩阵为多组学数据的嵌入特征时,输出矩阵为多药物特异性的细胞系特征;当第一输入矩阵为多组学数据的嵌入特征,第二输入矩阵为融合其他药物信息的药物特征时,输出矩阵为细胞系特异性的多药物特征
。5.
根据权利要求1或2所述的基于协同注意力的可解释性抗癌药物协同预测方法,其特征在于,每个药物

药物关联特征提取模块包括第二多头协同注意力网络

第三残差连接层及层归一化

第四前馈神经网络以及第四残差连接层及层归一化,在第二多头协同注意力网络中依据第三输入特征生成
Query
矩阵,第四输入特征生成
Key
矩阵和
Value
矩阵,
Query

【专利技术属性】
技术研发人员:杨波郭越曹戟何俏军胡海涛
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1