一种分子生成模型训练方法及装置制造方法及图纸

技术编号:39741634 阅读:25 留言:0更新日期:2023-12-17 23:42
本申请实施例提供了一种分子生成模型训练方法及装置

【技术实现步骤摘要】
一种分子生成模型训练方法及装置


[0001]本申请涉及人工智能
,特别是涉及一种分子生成模型训练方法及装置


技术介绍

[0002]基于人工智能的生成模型在药物设计领域备受关注,深度学习作为
AI(Artificial Intelligence
,人工智能
)
的最新进展,目前的生成模型的研究方向也聚焦于深度学习方向,目前已经开发出针对
RNN

VAE

GAN
以及
RL
等这些主流的深度学习框架的生成模型

这些模型被设计成能够按照药物研发人员不同需求执行各种不同的药物设计任务,能够使用不同的基于配体特征以及基于受体结构的药物设计来生成大量的新颖且多样的分子

[0003]近年来,已经开发出近
200
种基于深度学习的分子生成模型,但只有5种模型生成的分子被合成出来,说明这些模型生成的分子依然面临着难合成的情况

虽然已经有些模型在生成分子的结果中附加上化本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种分子生成模型训练方法,其特征在于,所述方法包括:采用第一样本分子对分子生成模型的分子预测层进行训练;基于蒙特卡洛树搜索算法,采用第二样本分子对所述分子生成模型的分子补全层进行训练;在达到训练终止条件时,基于训练后的分子预测层和训练后的分子补全层,得到所述分子生成模型
。2.
根据权利要求1所述的方法,其特征在于,所述采用第一样本分子对分子生成模型的分子预测层进行训练,包括:将所述第一样本分子输入至所述分子预测层;调用所述分子预测层,判断所述第一样本分子是否能够进行拆解;响应于所述第一样本分子能够进行拆解,对所述第一样本分子进行拆解,并根据拆解位置构建反应子备选库;根据所述反应子备选库中的目标反应子,计算得到所述分子预测层的损失值;基于所述损失值,更新所述分子预测层的模型参数;采用下一个第一样本分子对所述分子预测层继续进行训练,直至满足训练终止条件
。3.
根据权利要求2所述的方法,其特征在于,在所述采用第一样本分子对分子生成模型的分子预测层进行训练之前,还包括:基于分子的结构式,按照不同的化学反应对化学数据库中的化合物进行分割,得到切割后的反应子;对所述切割后的反应子进行去重处理,得到用于分子预测层训练的反应子;所述反应子包括:羰基单端反应子

双端氨基反应子

氨基

炔烃双端反应子

叠氮单端反应子

醛基单端反应子

卤代单端磺酰基

卤化烷单端烷基反应子中的至少一种
。4.
根据权利要求3所述的方法,其特征在于,所述对所述第一样本分子进行拆解,并根据拆解位置构建反应子备选库,包括:从所述第一样本分子中随机选择一个反应键,对所述第一样本分子进行拆解;根据拆解位置,从所述反应子中筛选出适配的目标反应子,并构建所述反应子备选库;其中,所述反应子备选库中包含第一数量正确的目标反应子和第二数量错误的目标反应子,所述第一数量小于所述第二数量
。5.
根据权利要求1所述的方法,其特征在于,所述基于蒙特卡洛树搜索算法,采用第二样本分子对所述分子生成模型的分子补全层进行训练,包括:对所述第二样本分子的反应子进行遮盖处理;基于蒙特卡洛树搜索算法,选择遮盖的反应子按照规则进行组合;调用所述分子补全层对组合的遮盖反应子进行补全处理;在补全节点为终点时,对补全的反应子进行打分处理,得到打分值;基于打分值更新所述分子补全层的模型参数;迭代执行上述过程,直至达到所述分子补全层的训练终止条件
。6.
根据权利要求5所述的方法,其特征在于...

【专利技术属性】
技术研发人员:王明阳谢昌谕侯廷军康玉潘培辰邓亚峰施慧
申请(专利权)人:杭州碳硅智慧科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1