一种基于图对比学习的药物联合使用预测方法技术

技术编号：40429775 阅读：8 留言：0更新日期：2024-02-20 22:51

本发明专利技术公开了一种基于图对比学习的药物联合使用预测方法，涉及生物信息学技术领域，所述方法包括以下步骤：步骤1、收集药物分子图和细胞系数据，对所述药物分子图进行图增强，对所述细胞系数据进行预处理；步骤2、用图卷积神经网络提取药物表示；步骤3、在所述药物分子图间实施对比学习；步骤4、训练药物联合使用预测模型；步骤5、评估所述药物联合使用预测模型。通过屏蔽节点特征和去除边缘的图增强策略，该模型学习分子内部的内在化学信息，并迫使模型学习分子参与各种反应之间的相关性，使得整体预测算法具有更好的泛化能力，同时避免由于过度拟合而导致的性能下降，并采用图卷积神经网络提取药物特征，对于新药预测的性能有较大提升。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及生物信息学，尤其涉及一种基于图对比学习的药物联合使用预测方法。

技术介绍

1、近年来，单一用药疗法对复杂疾病的疗效较差。由于表型和基因组因素的复杂相互作用，人类疾病具有高度的复杂性，通常同时由多条疾病通路所引起。如果只使用一种药物进行治疗，只能阻断部分疾病通路，剩余的疾病通路仍然可能导致疾病。为了解决这一困境，现代医学采用几种活性药物的联合使用疗法。药物联合使用疗法是指同时使用两种或两种以上药物来治疗一种疾病。相比于单一用药疗法，联合用药疗法使用每种药物的剂量较低，往往可以提高疗效、减少副作用、避免毒性、减缓耐药性的发展。除了癌症治疗，联合用药疗法还被有效应用于治疗艾滋病、真菌和细菌感染。然而，并不是每一种药物联合的组合都能提高疗效、克服耐药性、具有协同效果，某些组合可能会产生严重的不良反应，也就是拮抗效果。因此，如何快速准确地确定一种联合用药方案是否具有协同性十分关键。

2、在以往，发现协同药物组合的方法依赖于临床经验。然而，巨大的化学空间使得对所有药物联合使用方案进行临床分析既耗时又昂贵。之后，借助高通量筛选(high-throughput screening，hts)技术，可以筛选大量的癌细胞系，寻找潜在的协同药物组合。通过这些大规模的筛选方法，已经建立数千个药物组合数据库，大大加快了新药物组合的发现。随着被批准生产的药物数量不断增加，存在可能性的成对药物组合数量变得非常庞大。尽管hts可以在合理的时间内产生大量的测量结果，但是由于hts实验技术成本昂贵，在没有明确的组合策略时效率较低，利用hts

3、由于机器学习方法的准确性高、预测范围广，因此机器学习方法在药物联合使用预测中的应用越来越受欢迎。这类方法一般从药物的化学物理结构、细胞系基因表达谱和剂量反应曲线中手动提取特征，然后将提取的特征输入到随机森林、贝叶斯网络和梯度提升机等预测器中预测不同细胞系下的药物对的协同得分。

4、近年来，将深度学习应用于药物发现的研究发展也十分迅速。同样地，深度学习方法也需要以药物化学描述符和细胞系基因表达谱作为特征输入到不用的神经网络结构来自动学习潜在特征，最终用于药物协同得分预测。

5、然而，这些方法通过直接将分子作为图形数据处理来应用图嵌入算法，这可能会忽略每个药物独特的化学子结构模式。此外，由于带标签的分子数据量非常少，因为大多数只能在昂贵的湿实验室实验中检测到，并且以监督的方式直接在这些有限的数据集上训练模型可能导致过拟合和较差的泛化性能。

6、鱼亮等人在中国专利技术专利申请“基于药物相似性网络数据的药物组合预测方法”(申请号为cn201910507279.5)中基于药物相似性网络数据，通过构建包含药物相似性网络拓扑信息的药物组合特征和不固定药物组合特征维度，使用skip-gram方法和随机游走路径得到药物节点特征向量，使用所有已知的药物组合数据和药物节点特征向量训练随机森林分类模型，并利用该模型预测其他的药物组合得分。然而，该方法忽视了药物作为小分子结构本身所固有的结构信息，预测性能在泛化能力和可解释性上都受到限制。

7、因此，本领域的技术人员致力于开发一种新的药物联合使用预测方法，解决现有技术中存在的上述问题。

技术实现思路

1、有鉴于现有技术的上述缺陷，本专利技术所要解决的技术问题是如何解决现有传统机器学习、深度学习等直接将药物标识符作为药物分子向量嵌入方法的不足，提出了一种基于图对比学习的药物联用预测方法，提高预测性能和准确性。

2、为实现上述目的，本专利技术提供了一种基于图对比学习的药物联合使用预测方法，其特征在于，所述方法包括以下步骤：

3、步骤1、收集药物分子图和细胞系数据，对所述药物分子图进行图增强，对所述细胞系数据进行预处理；

4、步骤2、用图卷积神经网络提取药物表示；

5、步骤3、在所述药物分子图间实施对比学习；

6、步骤4、训练药物联合使用预测模型；

7、步骤5、评估所述药物联合使用预测模型。

8、进一步地，所述步骤1包括以下子步骤：

9、步骤1.1、从药物联用数据库中收集药物对-细胞系的三元组数据a-b-c和药物联合使用标签，其中，a-b代表一种药物对，a和b分别代表所述药物对中的药物名称，c代表一种细胞系；

10、步骤1.2、根据loewe加性评分来对所述药物联合使用标签进行量化，获得药物联合使用的协同效应1或者0，其中，1代表药物a与药物b在细胞系c中具有协同的药物联用效果，0则代表没有协同的药物联用效果，最终得到a-b-c-1或a-b-c-0形式的药物联用数据；

11、步骤1.3、根据药物名称a和b，获得药物对应的所述药物分子图，所述药物分子图被看作是无向图g＝(v,e)，其中，v表示节点集，e表示边集，并对所述药物分子图进行图增强，得到图视图

12、步骤1.4、收集细胞系c的数据，使用标记基因作为细胞系c的初始特征，从而量化所述细胞系数据，完成所述细胞系数据的预处理。

13、进一步地，在所述步骤1.1中，所述药物联用数据库包括o'neil数据集和forcina数据集，其中，将从所述o'neil数据集获得的数据作为训练集，将从所述forcina数据集获得的数据作为独立测试集。

14、进一步地，在所述步骤1.3中，所述图增强是通过去除边缘和屏蔽节点策略实现。

15、进一步地，所述步骤2包括以下子步骤：

16、步骤2.1、对所述药物分子图的节点级嵌入向量，并使用deepchem作为初始原子特征；

17、步骤2.2、用所述图卷积神经网络对所述药物分子图g进行药物表示的提取，获得所述药物分子图g中每个分子的节点级向量，再通过读出函数得到图级表示向量

18、步骤2.3、采用全连接层来降低所述细胞系数据的特征维数，并提取细胞系特征其中，所述全连接层是一个三层感知器。

19、进一步地，所述步骤2.2中的所述药物分子图g中的每个节点根据邻居节点发送的消息进行聚合和更新，迭代的具体过程为：

20、

21、所述图卷积神经网络的输入是节点特征矩阵和表示节点连接的邻接矩阵是邻接矩阵的度矩阵，wl是层权矩阵，σ表示激活函数，是第l层的输出，h(0)＝x,是整个所述图卷积神经网络的编码器的输出，所述编码器表示为:

22、进一步地，所述步骤2.2中通过所述读出函数得到所述图级表示向量具体为：

23、

24、其中，所述读出函数可以在sum、mean或maximum中选择；通过所述读出函数把所述节点级向量映射为所述图级表示向量

25、对于每个输入的所述药物对，计算所述药物分子图的两个所述图级表示向量:和并与所述步骤2.3中提取的所述本文档来自技高网...

【技术保护点】

1.一种基于图对比学习的药物联合使用预测方法，其特征在于，所述方法包括以下步骤：

2.如权利要求1所述的基于图对比学习的药物联合使用预测方法，其特征在于，所述步骤1包括以下子步骤：

3.如权利要求2所述的基于图对比学习的药物联合使用预测方法，其特征在于，在所述步骤1.1中，所述药物联用数据库包括O'Neil数据集和forcina数据集，其中，将从所述O'Neil数据集获得的数据作为训练集，将从所述forcina数据集获得的数据作为独立测试集。

4.如权利要求3所述的基于图对比学习的药物联合使用预测方法，其特征在于，在所述步骤1.3中，所述图增强是通过去除边缘和屏蔽节点策略实现。

5.如权利要求4所述的基于图对比学习的药物联合使用预测方法，其特征在于，所述步骤2包括以下子步骤：

6.如权利要求5所述的基于图对比学习的药物联合使用预测方法，其特征在于，所述步骤2.2中的所述药物分子图G中的每个节点根据邻居节点发送的消息进行聚合和更新，迭代的具体过程为：

7.如权利要求6所述的基于图对比学习的药物联合使用预测方法，

8.如权利要求7所述的基于图对比学习的药物联合使用预测方法，其特征在于，所述步骤3包括以下子步骤：

9.如权利要求8所述的基于图对比学习的药物联合使用预测方法，其特征在于，在所述步骤4中，将所述步骤2.2和所述步骤3.2中得到的损失函数整合为：

10.如权利要求9所述的基于图对比学习的药物联合使用预测方法，其特征在于，用所述独立测试集对所述步骤4中得到的所述药物联合使用预测模型进行评估，评估指标包括准确率、F1分数或AUC值，并判断在当前参数分布之下模型性能是否满足预先设定的标准，如果需要进一步调整参数，则在调整后重新训练模型。

...

【技术特征摘要】

1.一种基于图对比学习的药物联合使用预测方法，其特征在于，所述方法包括以下步骤：

2.如权利要求1所述的基于图对比学习的药物联合使用预测方法，其特征在于，所述步骤1包括以下子步骤：

3.如权利要求2所述的基于图对比学习的药物联合使用预测方法，其特征在于，在所述步骤1.1中，所述药物联用数据库包括o'neil数据集和forcina数据集，其中，将从所述o'neil数据集获得的数据作为训练集，将从所述forcina数据集获得的数据作为独立测试集。

4.如权利要求3所述的基于图对比学习的药物联合使用预测方法，其特征在于，在所述步骤1.3中，所述图增强是通过去除边缘和屏蔽节点策略实现。

5.如权利要求4所述的基于图对比学习的药物联合使用预测方法，其特征在于，所述步骤2包括以下子步骤：

6.如权利要求5所述的基于图对比学习的药物联合使用预测方法，其特征在于，所...

【专利技术属性】
技术研发人员：张立偲，杨新星，杨根科，褚健，
申请(专利权)人：上海交通大学宁波人工智能研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人