【技术实现步骤摘要】
一种基于机器翻译模型的先导化合物成药性优化方法
[0001]本公开实施例涉及医疗保健信息学
,尤其涉及一种基于机器翻译模型的先导化合物成药性优化方法。
技术介绍
[0002]目前,药物研发的最大的挑战之一就是如何高效的进行先导化合物优化,这也是药物化学家们面临的一大难题。超过50%化合物因为没有合适的吸收、分布、代谢、排泄(ADMET)和安全性质从而在药物研发的过程中失败,而ADMET性质优化是一个难度极高的多目标优化任务,要求在提高分子的成药性同时保持分子的活性;另一方面,空间大、经验少、成本高、耗时长等因素也使得高效进行化合物药代动力学性质和安全性的优化成为一大难题。而现有的技术一般是通过计算生成新分子,接着利用虚拟筛选程序对所产生的新化合物进行筛选以获得符合候选化合物,然而计算量巨大,或者通过预测模型对分子整体进行预测,不能针对成药性特定指标进行优化,且优化后药物的成药性不高,优化效率和适应性较差。
[0003]可见,亟需一种优化效率和适应性强的基于机器翻译模型的先导化合物成药性优化方法。
专利技 ...
【技术保护点】
【技术特征摘要】
1.一种基于机器翻译模型的先导化合物成药性优化方法,其特征在于,包括:利用预设数量的样本分子字符串训练翻译模型,其中,所述翻译模型包括编码器和解码器;根据机器学习算法建立多个药代动力学终点对应的计算模型,形成预测模型组;将初始分子字符串输入所述编码器,生成目标矢量;根据接收到的优化指令将所述目标矢量输入预测模型组,得到所述优化指令对应的优化预测指标;根据所述优化预测指标和所述初始分子字符串对应的计算指标进行加权平均计算,得到所述初始分子字符串的得分;根据所述目标矢量和所述得分,利用优化算法迭代预设次数得到优化分数集合,其中,所述优化分数集合包括多个优化矢量和每个所述优化矢量对应的优化得分;将所述优化分数集合输入所述解码器,利用预设算法计算每个所述优化矢量对应的字符串,形成目标分子字符串集合。2.根据权利要求1所述的方法,其特征在于,所述利用预设数量的样本分子字符串训练翻译模型的步骤,包括:分别将每个所述样本分子字符串输入所述编码器,并将所述编码器的输出结果输入所述解码器;将所述解码器的每个输出结果与其对应的样本分子字符串的真实标签的损失,并执行梯度更新。3.根据权利要求1所述的方法,其特征在于,所述根据机器学习算法建立多个药代动力学终点对应的计算模型,形成预测模型组的步骤,包括:从初始数据库内提取样本数据集;从所述样本数据集中提取与每个所述药代动力学终点对应的数据训练XGBoost算法,得到每个所述药代动力学终点对应的计算模型;根据全部所述药代动力学终点对应的计算模型形成所述预测模型组。4.根据权利要求3所述的方法...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。