可解释的分子生成模型制造技术

技术编号:33805233 阅读:32 留言:0更新日期:2022-06-16 10:12
可以提供一种用于训练具有可解释的隐空间的分子生成模型以标识来自从具有目标性质的输入分子生成的隐空间的生成的分子生成的子结构的方法。可以利用具有相关联的性质和已知子结构的分子结构的数据集来训练分子生成模型。该模型可以生成隐空间,在该隐空间中,子结构预测器模型可以被进一步训练以从具有目标性质和标识的子结构的输入分子预测具有目标性质的分子的子结构的数量。标性质的分子的子结构的数量。标性质的分子的子结构的数量。

【技术实现步骤摘要】
可解释的分子生成模型


[0001]本专利技术一般涉及分子结构生成模型的领域,并且更具体地涉及在由分子生成模型生成的分子结构中的子结构标识。

技术介绍

[0002]设计新的化合物可能是劳动密集型和昂贵的过程。在许多情况下,确定新化合物是否可以用于预期目的是通过反复试验来确定的。化学家或化学工程师进行湿法实验的进展是有限的,并且测试出每种可能的化合物是不切实际的。在许多工业中,包括汽车、制药、航空、半导体和农业中,需要具有已知性质的化合物的更快速开发。目前,存在具有拥有物理和化学性质的分子结构的库可用于研究。生成模型可以帮助研究者缩小对具有期望性质的分子结构的搜索范围。机器学习技术已经允许越来越大量的数据被分析和处理,包括分子结构的数据库。

技术实现思路

[0003]本公开的实施例包括用于训练分子生成模型的计算机实现的方法、计算机程序产品和系统。实施例包括用分子结构的数据集训练机器学习模型,以基于具有目标性质的输入分子结构生成具有目标性质的输出分子结构。此外,实施例包括从分子结构的数据集生成隐空间。另外,实施例包括训练子结构预测模型本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于训练分子生成模型的计算机实现的方法,所述方法包括:由一个或多个处理器使用分子结构的数据集训练分子生成模型,以基于具有目标性质的输入分子结构生成具有目标性质的输出分子结构;由一个或多个处理器从分子结构的数据集生成隐空间;以及由一个或多个处理器训练子结构预测模型,以基于生成的输入分子结构的隐空间来预测具有目标性质的输出分子结构的一个或多个子结构。2.根据权利要求1所述的计算机实现的方法,其中分子生成模型是变分自动编码器。3.根据权利要求1所述的计算机实现的方法,其中用于分子生成模型内的输入分子结构、输出分子结构和分子结构的数据集的分子结构的语法是简单分子输入线输入。4.根据权利要求1所述的计算机实现的方法,其中分子结构的数据集包括多个分子结构,其中每个分子结构具有性质数据和子结构数据。5.根据权利要求1所述的计算机实现的方法,其中训练子结构预测模型来预测一个或多个子结构还包括:由一个或多个处理器将隐空间内的局部隐单元的集合稀疏地分配给具有与来自分子结构数据集的分子结构相关联的多个子结构。6.一种用于训练分子生成模型的系统,所述系统包括:一个或多个计算机处理器;指令,当指令由一个或多个计算机处理器执行时,执行根据权利要求1

5中任一项所述...

【专利技术属性】
技术研发人员:S塔克达
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1