System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于Alpha-Beta剪枝与大语言模型加速催化材料筛选的方法技术_技高网

基于Alpha-Beta剪枝与大语言模型加速催化材料筛选的方法技术

技术编号:41013645 阅读:4 留言:0更新日期:2024-04-18 21:50
本发明专利技术提出了一种基于Alpha‑Beta剪枝与大语言模型(LLM)的催化剂快速筛选方法。这一系统旨在通过先进的LLM技术,在催化剂材料空间增强科学推理加速筛选。方法主要由以下模块组成:催化材料快速筛选模块,大语言模型催化材料特性表示模块。两个模块共同工作,实现了减少催化材料组合的搜索空间,快速筛选催化材料的功能。

【技术实现步骤摘要】

本专利技术涉及计算机应用技术与化学催化领域,具体为基于alpha-beta剪枝与大语言模型加速催化材料筛选的方法。


技术介绍

1、在催化材料筛选中,科学家投入了大量精力来提取相关科学文献中的化学术语、性质和合成参数等实体。相关的方法可以大致分为基于规则的、基于循环神经网络(rnn)和基于大型语言模型(llm)。基于规则的方法通常是无监督的,并且依赖于专家总结的字典或正则表达式规则。chemdataextractor 1.0是一种传统的文本挖掘工具,使用基于规则的方法从科学文档中提取化学信息,并使用该工具自动生成一些数据库。与基于循环神经网络(rnn)模型在处理各种实体类型方面表现出增强的灵活性。bilstm-crf在被应用于提取化学合成参数。近年来,bert的出现已成为许多nlp任务的最新技术。在特定领域的预训练bert都显著提升了催化材料的命名实体识别等任务的性能。但由于催化材料搜索空间巨大。提取文本条目之间的关系、提取材料科学中实体之间的关系用以缩小催化材料搜索空间,加速催化材料筛选一直是一个挑战。


技术实现思路

1、为解决上述问题,本专利技术公开了基于alpha-beta剪枝与大语言模型的催化材料快速筛选方法,在催化材料筛选领域中的应用根据已知的催化材料数据大大缩小催化材料搜索空间,还提高。了筛选的效率和精确度,显示出较现有技术更加先进和全面的优势。

2、基于alpha-beta剪枝与大语言模型的催化材料快速筛选方法,包括:大语言模型催化材料fine-tuning模块,用于通过微调llm来提升其对催化材料特性的表示性能。基于alpha-beta剪枝与llm的催化材料快速筛选模块:用于缩小催化材料筛选空间,加速催化材料筛选。

3、优先的,本专利技术提出了大语言模型催化材料特性表示模块,用于根据已有催化材料特性知识微调llm,提升llm对催化材料特性的表示性能。该模块的特征包括:

4、s1.选择chatglm3-6b作为基础模型。

5、s2.将科学论文中的文本提取为提示,其中包含多个段落具有模式信息。将答案以"模式名称:答案"的形式提取为完成。

6、s3.将数据集划分为训练集和测试集。

7、s4.使用失权重对模型进行训练。

8、优先的,上述模式名称包括但不限于命名实体识别(ner)、实体解析(er)、关系提取(re)和信息推理(ii)等任务。

9、优选的,所述的催化材料快速筛选模块包括一个树t,其中节点p表示搜索状态,边(p,aj)表示从节点p到节点aj的动作。折扣因子γ表示奖励的衰减率。储存的值n(p,aj)、v(p,aj)、p(p,aj)分别表示节点p执行动作aj的访问次数、价值和策略,奖励函数r表示节点p的奖励。该模块具体包括以下步骤:

10、

11、

12、alpha-beta剪枝步骤,在该步骤中,在搜索过程中使用alpha-beta剪枝来减少搜索空间。用于催化剂发现和用于材料设计。本专利技术的有益效果:

13、本专利技术的有益效果:

14、1、通过整合和发展alpha-beta剪枝技术和大语言模型,本专利技术提出了一个催化材料快速筛选方法。这一方法的主要特点和优势包括:通过结合alpha-beta剪枝和llm,可以快速准确地筛选催化材料,减少搜索空间,提高筛选效率。

15、2、通过对llm进行微调,可以提升其对催化材料特性的表示性能,进一步优化筛选结果。

16、3、使用alpha-beta剪枝算法可以进一步减少搜索空间,提高快速筛选的效率。

17、4、基于alpha-beta剪枝与llm的催化材料快速筛选模块可以广泛应用于催化剂发现、材料设计以及其他需要减少搜索空间的领域。

18、5、利用已有的催化材料特性知识,进一步优化llm在催化材料领域的表现能力;可以加快催化材料研究和开发的速度,缩短筛选周期,降低成本,并促进新催化材料的发现和应用。

本文档来自技高网...

【技术保护点】

1.基于Alpha-Beta剪枝与大语言模型加速催化材料筛选的方法,其特征在于:包括大语言模型催化材料模块和催化材料快速筛选模块,其中大语言模型催化材料模块用于通过微调LLM来提升其对催化材料特性的表示性能;催化材料快速筛选模块用于缩小催化材料筛选空间,加速催化材料筛选。

2.根据权利要求1所述的基于Alpha-Beta剪枝与大语言模型加速催化材料筛选的方法,其特征在于:大语言模型催化材料模块的操作的具体步骤如下:

3.根据权利要求2所述的基于Alpha-Beta剪枝与大语言模型加速催化材料筛选的方法,其特征在于:上述模式名称包含但不限于:命名实体识别(NER)、实体解析(ER)、关系提取(RE)和信息推理(II)任务。

4.根据权利要求1所述的基于Alpha-Beta剪枝与大语言模型加速催化材料筛选的方法,其特征在于:催化材料快速筛选模块操作的具体步骤为:

【技术特征摘要】

1.基于alpha-beta剪枝与大语言模型加速催化材料筛选的方法,其特征在于:包括大语言模型催化材料模块和催化材料快速筛选模块,其中大语言模型催化材料模块用于通过微调llm来提升其对催化材料特性的表示性能;催化材料快速筛选模块用于缩小催化材料筛选空间,加速催化材料筛选。

2.根据权利要求1所述的基于alpha-beta剪枝与大语言模型加速催化材料筛选的方法,其特征在于:大语言模型催化材...

【专利技术属性】
技术研发人员:卢新宇顾彦慧彭宁康李猛
申请(专利权)人:南京师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1