System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于贝叶斯优化的分子生成方法及装置制造方法及图纸_技高网

基于贝叶斯优化的分子生成方法及装置制造方法及图纸

技术编号:41270930 阅读:4 留言:0更新日期:2024-05-11 09:25
一种基于贝叶斯优化的分子生成方法及装置,属于分子生成技术领域;该方法将目标分子对象与分子性能的关系转化为函数表达式,并确定目标分子性能的最优值;确定目标分子对象的分子骨架,通过分子骨架确定分子输入信息的格式;根据分子输入信息的格式构建分子输入信息库,确定分子的生成空间;将目标分子对象的分子输入信息库和分子性能输入参数输入到贝叶斯算法中,进行迭代推荐,直到达到分子的性能的最优值,得到最终生成的候选目标分子对象。本发明专利技术通过构建分子骨架的方法,生成大量的分子并使得分子生成的方向可控。同时使用贝叶斯优化算法可以通过快速迭代获取最佳候选分子,从而实现最终分子生成的目标。

【技术实现步骤摘要】

本专利技术属于分子生成,具体涉及一种基于贝叶斯优化的分子生成方法及装置


技术介绍

1、当代化工、制药、食品等领域的产品开发通常需要发现新的分子。传统的分子设计依赖于人类的专业知识来提出、合成和测试新分子,但这个过程往往耗时且成本高,限制了实际可测试的分子数量。分子生成建模提供了另一种方法,通过设定目标条件来引导分子的生成过程。目前,循环神经网络、自编码器、生成对抗网络等深度学习模型是主流的分子生成方法。这些方法在给定明确的条件下能够生成大量的分子,并且在已知分子构效关系的条件下,生成的候选分子性能表现出色。然而,这些方法生成分子的方向很难掌握,即难以确定生成的新分子与现有分子的相似程度。这经常导致最终生成的候选分子在实验合成过程中遇到困难、成本高,甚至无法成功合成,进而使得分子生成在实际实验阶段难以实施,甚至合成失败。

2、因此,如何在生成性能优异的分子的同时确保分子的可控性,成为分子生成领域面临着一个急需解决的问题。


技术实现思路

1、为此,本专利技术提供一种基于贝叶斯优化的分子生成方法及装置,通过构建分子骨架的方法,生成大量的分子并使得分子生成的方向可控。同时使用贝叶斯优化算法可以通过快速迭代获取最佳候选分子,从而实现最终分子生成的目标。

2、为了实现上述目的,本专利技术提供如下技术方案:基于贝叶斯优化的分子生成方法,包括:

3、将目标分子对象与目标分子性能的关系转化为函数表达式,并通过经验统计知识确定满足预设条件的所述目标分子性能的最优值

4、确定所述目标分子对象的分子骨架,通过所述目标分子对象的分子骨架确定所述目标分子对象的分子输入信息的格式;根据所述目标分子对象的分子输入信息的格式构建所述目标分子对象的分子输入信息库,确定所述目标分子对象的生成空间;

5、将所述目标分子对象转化为所述目标分子对象的分子输入信息格式,通过对所述目标分子对象的分子输入信息库中未出现的位点编码进行重新组合,构成新分子;将所述新分子通过所述函数表达式计算所述新分子的性能;将所述新分子转化为所述目标分子对象的分子输入信息格式,更新到所述目标分子对象的分子输入信息中,得到所述目标分子对象的最终分子性能输入参数;

6、将所述目标分子对象的分子输入信息库和所述目标分子对象的分子性能输入参数输入到贝叶斯算法中,通过所述贝叶斯算法进行迭代推荐,直到满足预设条件下所述目标分子对象的性能的最优值,得到最终生成的候选目标分子对象。

7、作为基于贝叶斯优化的分子生成方法优选方案,当所述目标分子对象与所述目标分子性能的构效关系明确时,所述目标分子对象与所述目标分子性能的关系通过分子描述符和分子性能构建的模型确定;所述模型包括树模型、支持向量机、随机森林、核岭回归、多层感知机若干机器学习模型中的至少一种,也可以根据需要选择其它相关的模型,所述模型的函数表达式为所述模型的函数方程;

8、当所述目标分子对象与所述目标分子性能的构效关系不明确时,所述模型的函数表达式通过实验获得分子性能值确定。

9、作为基于贝叶斯优化的分子生成方法优选方案,确定所述目标分子对象的分子骨架,是通过对所述目标分子对象进行分析,保留所述目标分子对象中相同的框架,将所述目标分子对象中可变部分划分出来;每个所述可变部分作为一个位点,并进行编号;对每个编号的位点进行枚举,并将每个位点的枚举情况转化为整数编码;构建每个位点枚举情况和所述整数编码的位点字典,并通过所述位点字典与位点编号构成分子输入信息库,确定所述目标分子对象的生成空间。

10、作为基于贝叶斯优化的分子生成方法优选方案,将所述目标分子对象转化为所述目标分子对象的分子输入信息格式时,所述输入信息格式包括所述目标分子对象的所有位点编码和分子性能值。

11、作为基于贝叶斯优化的分子生成方法优选方案,将所述目标分子对象的分子输入信息库去掉位点枚举名信息,改为含有数值的列表,得到贝叶斯搜索空间输入;在所述贝叶斯搜索空间输入中添加所述目标分子对象的分子性能输入参数,形成所述目标分子对象的贝叶斯优化的初始输入;

12、所述贝叶斯优化步骤为:

13、第一步,代入所述目标分子对象的贝叶斯优化的初始输入,进行贝叶斯优化算法第一次推荐,推荐得到第一组所述目标分子对象的输入信息和对应的分子性能;

14、第二步,若第一组所述目标分子对象的输入信息对应的分子性能不满足设定的所述目标分子性能的最优值,则通过所述函数表达式计算第一组所述目标分子对象的输入信息的分子性能值,并将第一组所述目标分子对象的输入信息的分子性能值更新到所述目标分子对象的分子性能输入参数中;然后进行贝叶斯优化算法第二次推荐;若第一组所述目标分子对象的输入信息对应的分子性能满足设定的所述目标分子性能的最优值,则进入第三步;

15、第三步,将满足设定的所述目标分子性能的最优值的一组所述目标分子对象的输入信息通过所述函数表达式检验这一组分子的分子性能;若计算得到的值不满足设定的所述目标分子性能的最优值,则继续通过贝叶斯优化算法推荐;若满足设定的所述目标分子性能的最优值,则最终生成的候选目标分子对象。

16、本专利技术还提供一种基于贝叶斯优化的分子生成装置,采用上述的基于贝叶斯优化的分子生成方法,包括:

17、分子关系函数表达式转化模块,用于将目标分子对象与目标分子性能的关系转化为函数表达式,并通过经验统计知识确定满足预设条件的所述目标分子性能的最优值;

18、分子生成空间确定模块,用于确定所述目标分子对象的分子骨架,通过所述目标分子对象的分子骨架确定所述目标分子对象的分子输入信息的格式;根据所述目标分子对象的分子输入信息的格式构建所述目标分子对象的分子输入信息库,确定所述目标分子对象的生成空间;

19、分子性能输入参数生成模块,用于将所述目标分子对象转化为所述目标分子对象的分子输入信息格式,通过对所述目标分子对象的分子输入信息库中未出现的位点编码进行重新组合,构成新分子;将所述新分子通过所述函数表达式计算所述新分子的性能;将所述新分子转化为所述目标分子对象的分子输入信息格式,更新到所述目标分子对象的分子输入信息中,得到所述目标分子对象的最终分子性能输入参数;

20、目标分子对象生成模块,用于将所述目标分子对象的分子输入信息库和所述目标分子对象的分子性能输入参数输入到贝叶斯算法中,通过所述贝叶斯算法进行迭代推荐,直到满足预设条件下所述目标分子对象的性能的最优值,得到最终生成的候选目标分子对象。

21、作为基于贝叶斯优化的分子生成装置优选方案,在所述分子关系函数表达式转化模块中,当所述目标分子对象与所述目标分子性能的构效关系明确时,所述目标分子对象与所述目标分子性能的关系通过分子描述符和分子性能构建的模型确定;所述模型包括树模型、支持向量机、随机森林、核岭回归、多层感知机若干机器学习模型中的至少一种,也可以根据需要选择其它相关的模型,所述模型的函数表达式为所本文档来自技高网...

【技术保护点】

1.基于贝叶斯优化的分子生成方法,其特征在于,包括:

2.根据权利要求1所述的基于贝叶斯优化的分子生成方法,其特征在于,当所述目标分子对象与所述目标分子性能的构效关系明确时,所述目标分子对象与所述目标分子性能的关系通过分子描述符和分子性能构建的模型确定;所述模型包括树模型、支持向量机、随机森林、核岭回归、多层感知机若干机器学习模型中的至少一种,所述模型的函数表达式为所述模型的函数方程;

3.根据权利要求2所述的基于贝叶斯优化的分子生成方法,其特征在于,确定所述目标分子对象的分子骨架,是通过对所述目标分子对象进行分析,保留所述目标分子对象中相同的框架,将所述目标分子对象中可变部分划分出来;

4.根据权利要求3所述的基于贝叶斯优化的分子生成方法,其特征在于,将所述目标分子对象转化为所述目标分子对象的分子输入信息格式时,所述输入信息格式包括所述目标分子对象的所有位点编码和分子性能值。

5.根据权利要求4所述的基于贝叶斯优化的分子生成方法,其特征在于,将所述目标分子对象的分子输入信息库去掉位点枚举名信息,改为含有数值的列表,得到贝叶斯搜索空间输入;在所述贝叶斯搜索空间输入中添加所述目标分子对象的分子性能输入参数,形成所述目标分子对象的贝叶斯优化的初始输入;

6.基于贝叶斯优化的分子生成装置,采用权利要求1至5任一项所述的基于贝叶斯优化的分子生成方法,其特征在于,包括:

7.根据权利要求6所述的基于贝叶斯优化的分子生成装置,其特征在于,在所述分子关系函数表达式转化模块中,当所述目标分子对象与所述目标分子性能的构效关系明确时,所述目标分子对象与所述目标分子性能的关系通过分子描述符和分子性能构建的模型确定;所述模型包括树模型、支持向量机、随机森林、核岭回归、多层感知机若干机器学习模型中的至少一种,所述模型的函数表达式为所述模型的函数方程;

8.根据权利要求7所述的基于贝叶斯优化的分子生成装置,其特征在于,在所述分子生成空间确定模块中,确定所述目标分子对象的分子骨架,是通过对所述目标分子对象进行分析,保留所述目标分子对象中相同的框架,将所述目标分子对象中可变部分划分出来;每个所述可变部分作为一个位点,并进行编号;对每个编号的位点进行枚举,并将每个位点的枚举情况转化为整数编码;构建每个位点枚举情况和所述整数编码的位点字典,并通过所述位点字典与位点编号构成分子输入信息库,确定所述目标分子对象的生成空间。

9.根据权利要求8所述的基于贝叶斯优化的分子生成装置,其特征在于,在所述分子性能输入参数生成模块中,将所述目标分子对象转化为所述目标分子对象的分子输入信息格式时,所述输入信息格式包括所述目标分子对象的所有位点编码和分子性能值。

10.根据权利要求9所述的基于贝叶斯优化的分子生成装置,其特征在于,

...

【技术特征摘要】

1.基于贝叶斯优化的分子生成方法,其特征在于,包括:

2.根据权利要求1所述的基于贝叶斯优化的分子生成方法,其特征在于,当所述目标分子对象与所述目标分子性能的构效关系明确时,所述目标分子对象与所述目标分子性能的关系通过分子描述符和分子性能构建的模型确定;所述模型包括树模型、支持向量机、随机森林、核岭回归、多层感知机若干机器学习模型中的至少一种,所述模型的函数表达式为所述模型的函数方程;

3.根据权利要求2所述的基于贝叶斯优化的分子生成方法,其特征在于,确定所述目标分子对象的分子骨架,是通过对所述目标分子对象进行分析,保留所述目标分子对象中相同的框架,将所述目标分子对象中可变部分划分出来;

4.根据权利要求3所述的基于贝叶斯优化的分子生成方法,其特征在于,将所述目标分子对象转化为所述目标分子对象的分子输入信息格式时,所述输入信息格式包括所述目标分子对象的所有位点编码和分子性能值。

5.根据权利要求4所述的基于贝叶斯优化的分子生成方法,其特征在于,将所述目标分子对象的分子输入信息库去掉位点枚举名信息,改为含有数值的列表,得到贝叶斯搜索空间输入;在所述贝叶斯搜索空间输入中添加所述目标分子对象的分子性能输入参数,形成所述目标分子对象的贝叶斯优化的初始输入;

6.基于贝叶斯优化的分子生成装置,采用权利要求1至5任一项所述的基于贝叶斯优化的分子生...

【专利技术属性】
技术研发人员:柳彦宏胡钧员李中伟林衍森肖波
申请(专利权)人:烟台国工智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1