一种基于选择性采样学习的多目标分子优化方法及系统技术方案

技术编号：37415413 阅读：18 留言：0更新日期：2023-04-30 09:39

本发明专利技术公开了一种基于选择性采样学习的多目标分子优化方法，包括：初始化分子生成模型；基于初始化的分子生成模型进行分子采样，每次分子采样会采样一个批次的分子形成第一分子集；计算第一分子集内每个分子的第一指标、第二指标和第三指标；根据预设第一指标阈值、第二指标阈值和第三指标阈值与第一指标、第二指标和第三指标的比较结果对第一分子集中的每个分子进行过滤，对均达到标准的分子被保留，任一指标没有达到的分子被丢弃；循环直到过滤后获得的分子数量等于或高于第一分子数量阈值后停止循环，获得第二分子集；基于第一评价标准筛选第二分子集获得第三分子集；将第三分子集用于分子生成模型的训练和参数更新。还公开对应系统及应用。新。还公开对应系统及应用。新。还公开对应系统及应用。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于选择性采样学习的多目标分子优化方法及系统

[0001]本专利技术属于生物基因和人工智能药物研究
，尤其涉及一种基于选择性采样学习的多目标分子优化方法及系统。

技术介绍

[0002]在药物分子合成与优化领域中，要保证一款药物的安全性和有效性，则需要确保多项指标达到临床要求，这些指标包括与特定蛋白质靶点结合的活性、药物进入体内的毒性和药物代谢速度等等。在新药研发过程中，首先需要找到苗头化合物，之后会对其进行多指标优化，而这个优化过程往往是专家根据经验来进行，速度较慢并且效率有限，因此如何自动化地进行优化，并高效地提升苗头化合物的各项指标则至关重要。随着机器学习的兴起，AI新药研发这一交叉领域得到了很好的发展，这一领域也涌现了很多关于分子优化的方法。目前常用的方法有基于强化学习的方法和基于蒙特卡洛树搜索的方法，共同点都是关注药物研发中的关键指标，然后使用计算的方法将其变成优化目标并进行模型训练，最终达到优化分子多个指标的目的。
[0003]基于强化学习的方法通常是将分子表示成基于分子图的图形式。在训练的过程中，模型会将分子子图作为强化学习中的“状态”，对分子子图进行诱导和补全，让生成的分子在关键指标上满足期待，进而完成对分子的优化。但实际上，只要对一个分子进行微小的改造，就可能会让其在活性和毒性等多方面产生巨大的变化。因此，在知道最终分子各项属性的前提下，无法准确地评估中间分子的各项属性，这也就给强化学习这一类的方法带来了很多局限性。
[0004]基于蒙特卡洛树搜索的方法的核心是将分子表示成一...

【技术保护点】

【技术特征摘要】
1.一种基于选择性采样学习的多目标分子优化方法，其特征在于，包括：S1，初始化分子生成模型；S2，基于初始化的分子生成模型进行分子采样，每次分子采样会采样一个批次的分子形成第一分子集；S3，计算第一分子集内每个分子的第一指标、第二指标和第三指标；S4，根据预设好的第一指标阈值、第二指标阈值和第三指标阈值，分别将所述第一指标、第二指标和第三指标与所述第一指标阈值、第二指标阈值和第三指标阈值比较，根据比较结果对所述第一分子集中的每个分子进行过滤，对所述第一指标、第二指标和第三指标均达到第一指标阈值、第二指标阈值和第三指标阈值的标准的分子被保留，所述第一指标、第二指标和第三指标中任一指标没有达到所述第一指标阈值、第二指标阈值和第三指标阈值的标准的分子被丢弃；S5，设定第一分子数量阈值，循环S1
‑
S4，直到过滤后获得的分子数量等于或高于所述第一分子数量阈值后停止所述循环，获得第二分子集；S6，基于第一评价标准再次筛选所述第二分子集获得第三分子集；S7，将第三分子集用于所述分子生成模型的训练和参数更新。2.根据权利要求1所述的一种基于选择性采样学习的多目标分子优化方法，其特征在于，所述第一指标为物化属性，所述第二指标为ADMET，所述第三指标为活性。3.根据权利要求2所述的一种基于选择性采样学习的多目标分子优化方法，其特征在于，所述第一评价标准为：保留所述第二分子集M1中活性高于整体中位数的分子作为第三分子集。4.根据权利要求3所述的一种基于选择性采样学习的多目标分子优化方法，其特征在于，所述初始化的分子生成模型为图形的深度生成模型DGMG、子图生成的连接树变分自动编码器JTNN、GCPN、MRNN或PS
‑
VAE。5.根据权利要求1所述的一种基于选择性采样学习的多目标分子优化方法，其特征在于，所述S1实施前还包括提前使用公开数据集ZINC对初始化的分子生成模型进行预训练。6.根据权利要求1所述的一种基于选择性采样学习的多目标分子优化方法，其特征在于，所述方法还包括：S8，在所述分子生成模型的训练和参数更新结束后，使用训练好的所述分子生成模型...

【专利技术属性】
技术研发人员：刘勇，柳俊宏，王鹏磊，李欣泽，
申请(专利权)人：星希尔生物科技上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人