基于预训练微调的药物分子优化方法及装置制造方法及图纸

技术编号:39577040 阅读:18 留言:0更新日期:2023-12-03 19:28
本发明专利技术一种基于预训练微调的药物分子优化方法及装置,方法包括:制作数据集,收集包含有优化属性参数的药物分子数据,将药物分子数据两两配对,形成分子对;分别计算每个分子对中分子之间的相似度,保留相似度在设定阈值范围内的分子对,将每个分子对中的分子按照优化属性参数的大小顺序排列,并添加优化属性标签,形成属性优化数据集,将属性优化数据集划分为训练集和验证集;将训练集输入预训练模型进行训练,建立起始分子与目标分子之间的映射关系;将验证集输入训练好的预训练模型中,在目标分子概率空间中进行采样,输出最终生成的目标分子

【技术实现步骤摘要】
基于预训练微调的药物分子优化方法及装置


[0001]本专利技术涉及计算机辅助药物设计
,尤其是一种基于预训练微调的药物分子优化方法及装置


技术介绍

[0002]药物分子的设计和优化涉及到大量的分子结构

性质

生物活性等复杂信息

传统的方法往往基于经验和规则,依赖于专业化的领域知识,无法全面考虑各种因素的综合影响

计算机辅助药物设计
(Computer

Aided Drug Design

CADD)
技术的应用为药物研发提供了一种新的方法

基于预训练微调的药物分子优化方法代表了药物研发领域中的一种创新尝试,结合了深度学习的优势和药物分子设计的特点

[0003]预训练模型是一种能够自动学习数据中潜在关系的机器学习方法

预训练模型可以从大规模的分子数据中学习到分子结构和性质之间的复杂关联,为药物分子的优化提供更加智能和高效的方法
。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于预训练微调的药物分子优化方法,其特征在于,包括:制作数据集,收集包含有优化属性参数的药物分子数据,将所述药物分子数据两两配对,形成分子对;分别计算每个分子对中分子之间的相似度,保留相似度在设定阈值范围内的分子对,将每个分子对中的分子按照优化属性参数的大小顺序排列,并添加优化属性标签,形成属性优化数据集,其每条样本中分子对的形式为
[
起始分子,目标分子
]
,将所述属性优化数据集划分为训练集和验证集;将所述训练集输入预训练模型进行训练,建立起始分子与目标分子之间的映射关系;将所述验证集输入训练好的预训练模型中,在目标分子概率空间中进行采样,输出最终生成的目标分子
。2.
根据权利要求1所述的基于预训练微调的药物分子优化方法,其特征在于,将每个分子对中的分子按照优化属性参数的大小顺序排列之后,在形成属性优化数据集之前,还包括:对于具有相同起始分子

不同目标分子的分子对,保留起始分子与目标分子的优化属性参数的差值最大的分子对
。3.
根据权利要求1所述的基于预训练微调的药物分子优化方法,其特征在于,所述在目标分子概率空间中进行采样,输出最终生成的目标分子,包括采用集束搜索法进行采样:根据模型的初始状态和输入,生成多个初始候选分子,每个初始候选分子对应一个开始符;对于每个初始候选分子,利用集束搜索得到下一时刻模型预测的可能的目标分子,并获得相应的标识符,将所述标识符与初始符拼接,构成新的候选序列;使用模型预测的分数

概率或其他评价指标评估每个候选序列的质量;根据候选序列的评估分数,选择得分最高的若干个候选序列,成为下一时刻的搜索空间;继续在所述下一时刻的搜索空间集束搜索得到下一时刻模型预测的可能的目标分子,重复进行候选序列的更新

评估和可能的目标分子的输出,直至生成完整的分子结构或达到终止条件
。4.
根据权利要求3所述的基于预训练微调的药物分子优化方法,其特征在于,还包括对目标分子质量进行评估,评估指标包括:目标分子与输入的...

【专利技术属性】
技术研发人员:于文龙顾忠泽成昊
申请(专利权)人:江苏运动健康研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1