预测分子结构的方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:43009922 阅读:30 留言:0更新日期:2024-10-18 17:16
本公开涉及计算机技术领域,公开了预测分子结构的方法、装置、计算机设备及存储介质,该方法包括:利用目标分子生成模型,根据目标分子生成模型的输入、预测分子结构的第1个令牌至第i‑1个令牌,预测出第i个令牌的第一概率分布;根据预测分子结构的第1个令牌至第i‑1个令牌,目标路径集,确定每个候选令牌对应的路径集;根据候选令牌对应的路径集中对应的分子质量分数大于相应分子质量分数阈值的路径的数量、候选令牌对应的路径集中路径的数量,计算候选令牌的分数;根据每个候选令牌的分数、第i个令牌的第一概率分布,得到第i个令牌的第二概率分布;根据第二概率分布,确定出预测分子结构的第i个令牌。

【技术实现步骤摘要】

本公开涉及计算机,具体涉及一种预测分子结构的方法、装置、计算机设备及存储介质


技术介绍

1、利用用于预测分子结构的模型例如基于transformer模型预测分子结构被广泛应用在新药研发例如小分子新药研发。分子生成在的主要目标是根据输入的特定靶点的口袋pocket,生成种类多样,质量较好的分子结构。

2、目前,将用于预测分子结构的模型的输出作为最终的结果。预测结果的准确性完全依赖于模型的精度。然而,模型的学习是基本依赖于训练数据的分布,如果在推理阶段所需要推理数据的特征分布离训练数据集较远时,会出现某一位置的令牌(token)的预测出现明显的偏好并且这种偏好并非有益的情况,导致预测出的分子结构的准确性的降低。如何提升预测出的分子结构的准确性的准确性成为一个需要解决的问题。


技术实现思路

1、有鉴于此,本公开实施例提供了一种预测分子结构的方法、装置、计算机设备及存储介质。

2、第一方面,本公开实施例提供了一种预测分子结构的方法,该方法包括:

3、利用经过预训练的目标分子生成模本文档来自技高网...

【技术保护点】

1.一种预测分子结构的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,根据所述候选token对应的路径集中对应的分子质量分数大于相应分子质量分数阈值的路径的数量、所述候选token对应的路径集中路径的数量,计算所述候选token的分数包括:

3.根据权利要求2所述的方法,其特征在于,根据所述候选token对应的路径集中对应的分子质量分数大于中等级分子质量分数阈值的路径的数量、所述候选token对应的路径集中对应的分子质量分数大于高等级分子质量分数阈值的路径的数量,计算所述候选token的分数包括:

4.根据权利要求3所述的方...

【技术特征摘要】

1.一种预测分子结构的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,根据所述候选token对应的路径集中对应的分子质量分数大于相应分子质量分数阈值的路径的数量、所述候选token对应的路径集中路径的数量,计算所述候选token的分数包括:

3.根据权利要求2所述的方法,其特征在于,根据所述候选token对应的路径集中对应的分子质量分数大于中等级分子质量分数阈值的路径的数量、所述候选token对应的路径集中对应的分子质量分数大于高等级分子质量分数阈值的路径的数量,计算所述候选token的分数包括:

4.根据权利要求3所述的方法,其特征在于,根据所述候选token对应的路径集中对应的分子质量分数大于中等级分子质量分数阈值的路径的数量、所述候选token对应的路径集中对应的分子质量分数大于高等级分子质量分数阈值的路径的数量、所述候选token...

【专利技术属性】
技术研发人员:朱彦浩冯伟周文彪黄博
申请(专利权)人:北京望石智慧科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1