【技术实现步骤摘要】
本专利技术属于化学信息学,尤其涉及一种基于大型语言模型的化学反应产率预测方法及装置。
技术介绍
1、化学反应产率预测及优化一直是化学合成及制药领域的热门话题和难题,传统上产率预测和优化工作主要凭借化学家自身知识经验,以及利用商业数据库寻找合适的反应条件,从而高产率合成目标分子,以达到降本增效的目的。
2、近年来兴起的人工智能算法被广泛用于化学反应产率预测和优化工作。其中有两篇较有影响力的工作。2018年derek t ahneman等人(science,360(6385):186-190,2018)以buchwald-hartig(布赫瓦尔德-哈特维希)偶联为模版反应,基于随机森林(randomforest)算法进行产率预测,将4609个反应组合划分为训练集和测试集,在测试集上得到较好的结果;在2022年jing dong等人(journal of computational chemistry,43(4):289-302,2022)同样以buchwald-hartwig偶联为模板反应,基于极端梯度提升(xgboost)算法
...【技术保护点】
1.一种基于大型语言模型的化学反应产率预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于大型语言模型的化学反应产率预测方法,其特征在于,所述步骤(2)中通过大型语言模型ChatGPT 3.5/4.0生成网页爬虫Python代码,是通过运用上下文学习方法ICL使得化学反应产率预测人工智能助手能够生成所需的高质量的网页爬虫代码;所述ICL用于专注于在特定上下文中学习和适应的语言模型,能够使大型语言模型能够理解并生成与给定上下文相关的输出。
3.根据权利要求1所述的一种基于大型语言模型的化学反应产率预测方法,其特征在于,所述步骤(
...【技术特征摘要】
1.一种基于大型语言模型的化学反应产率预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于大型语言模型的化学反应产率预测方法,其特征在于,所述步骤(2)中通过大型语言模型chatgpt 3.5/4.0生成网页爬虫python代码,是通过运用上下文学习方法icl使得化学反应产率预测人工智能助手能够生成所需的高质量的网页爬虫代码;所述icl用于专注于在特定上下文中学习和适应的语言模型,能够使大型语言模型能够理解并生成与给定上下文相关的输出。
3.根据权利要求1所述的一种基于大型语言模型的化学反应产率预测方法,其特征在于,所述步骤(3)中最终反应条件推荐包括以下步骤:
4.根据权利要求2所述的一种基于大型语言模型的化学反应产率预测方法,其特征在于,所述步骤(3.2)中的机器学习模型为tt模型,即表格转换器;所述tt模型是一种神经网络模型,其自注意力机制能够捕捉并权衡输入数据中每部分的重要性,以及用于处理表格数据。
5.根据权利要求2所述的一种基于大型语言模型的化学反应产率预测方法,其特征在于,所述(3.2)中使用化学信息分子图描述符对反应条件进行编码;具体是将每个化学组分的cimg描述符串联,形成每个反应的数...
【专利技术属性】
技术研发人员:李俊友,陈柯辛,李蓝青,于佳卉,裘捷中,陈广勇,王平安,
申请(专利权)人:之江实验室,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。