当前位置: 首页 > 专利查询>之江实验室专利>正文

一种基于大型语言模型的化学反应产率预测方法及装置制造方法及图纸

技术编号:41531915 阅读:21 留言:0更新日期:2024-06-03 23:08
本发明专利技术公开了一种基于大型语言模型的化学反应产率预测方法及装置,利用大型语言模型从文献数据库中收集并参考类似的化学反应,来预测和优化新的化学反应的产率,旨在弥合现有产率预测模型与经验丰富的化学家之间的差距。通过用大语言模型生成代码来访问PubChem和Sci‑Finder等化学数据库,该人工智能助手可以像化学家一样访问最新且实时更新的文献数据,从而提高现有产率预测算法泛化能力以及实时知识获取能力。

【技术实现步骤摘要】

本专利技术属于化学信息学,尤其涉及一种基于大型语言模型的化学反应产率预测方法及装置


技术介绍

1、化学反应产率预测及优化一直是化学合成及制药领域的热门话题和难题,传统上产率预测和优化工作主要凭借化学家自身知识经验,以及利用商业数据库寻找合适的反应条件,从而高产率合成目标分子,以达到降本增效的目的。

2、近年来兴起的人工智能算法被广泛用于化学反应产率预测和优化工作。其中有两篇较有影响力的工作。2018年derek t ahneman等人(science,360(6385):186-190,2018)以buchwald-hartig(布赫瓦尔德-哈特维希)偶联为模版反应,基于随机森林(randomforest)算法进行产率预测,将4609个反应组合划分为训练集和测试集,在测试集上得到较好的结果;在2022年jing dong等人(journal of computational chemistry,43(4):289-302,2022)同样以buchwald-hartwig偶联为模板反应,基于极端梯度提升(xgboost)算法,进一步提高产率预测本文档来自技高网...

【技术保护点】

1.一种基于大型语言模型的化学反应产率预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于大型语言模型的化学反应产率预测方法,其特征在于,所述步骤(2)中通过大型语言模型ChatGPT 3.5/4.0生成网页爬虫Python代码,是通过运用上下文学习方法ICL使得化学反应产率预测人工智能助手能够生成所需的高质量的网页爬虫代码;所述ICL用于专注于在特定上下文中学习和适应的语言模型,能够使大型语言模型能够理解并生成与给定上下文相关的输出。

3.根据权利要求1所述的一种基于大型语言模型的化学反应产率预测方法,其特征在于,所述步骤(3)中最终反应条件推...

【技术特征摘要】

1.一种基于大型语言模型的化学反应产率预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于大型语言模型的化学反应产率预测方法,其特征在于,所述步骤(2)中通过大型语言模型chatgpt 3.5/4.0生成网页爬虫python代码,是通过运用上下文学习方法icl使得化学反应产率预测人工智能助手能够生成所需的高质量的网页爬虫代码;所述icl用于专注于在特定上下文中学习和适应的语言模型,能够使大型语言模型能够理解并生成与给定上下文相关的输出。

3.根据权利要求1所述的一种基于大型语言模型的化学反应产率预测方法,其特征在于,所述步骤(3)中最终反应条件推荐包括以下步骤:

4.根据权利要求2所述的一种基于大型语言模型的化学反应产率预测方法,其特征在于,所述步骤(3.2)中的机器学习模型为tt模型,即表格转换器;所述tt模型是一种神经网络模型,其自注意力机制能够捕捉并权衡输入数据中每部分的重要性,以及用于处理表格数据。

5.根据权利要求2所述的一种基于大型语言模型的化学反应产率预测方法,其特征在于,所述(3.2)中使用化学信息分子图描述符对反应条件进行编码;具体是将每个化学组分的cimg描述符串联,形成每个反应的数...

【专利技术属性】
技术研发人员:李俊友陈柯辛李蓝青于佳卉裘捷中陈广勇王平安
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1