一种基于语义理解的晶体材料结构生成方法、计算机可读存储介质及计算机程序产品技术

技术编号:43117643 阅读:26 留言:0更新日期:2024-10-26 09:55
一种基于语义理解的晶体材料结构生成方法,包括:首先,使用大语言模型对用户的自然语言查询进行结构化处理;其次,对于单质材料的查询,通过单质晶态结构数据库构建晶体结构;接着,对于指定常见晶体结构类型的查询,利用材料模拟工具库进行结构构建;对于非单质且未指明常见结构的化学式,执行一般晶态材料数据库查询;若数据库查询无匹配结果,通过元素代换查询可能相关的晶体结构;最终,将查询得到的晶体结构信息转换成合适的文件格式输出。本方法通过自然语言处理技术,实现了非结构性数据与结构性数据的有效整合,简化材料科研人员对晶体结构信息的查询过程。

【技术实现步骤摘要】

本专利技术涉及材料晶体结构数据库以及大语言模型的应用,特别是涉及一种基于语义理解的晶体材料结构生成方法。


技术介绍

1、自“材料基因组计划”以来,基于高通量、机器学习的数据驱动的材料信息学研究范式日趋重要。以 materials project为代表的材料数据库是其基石之一。materialsproject 材料数据库含有十余万电池、光伏、热电、催化等材料条目,可通过网页、rest api或python库访问。如何让研究人员更加方便高效地实现对 materials project 数据库的访问,从而有利于推进材料信息学研究,是现有技术所面临的一项挑战。

2、需要说明的是,在上述
技术介绍
部分公开的信息仅用于对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。


技术实现思路

1、近年来,以 openai 的生成式预训练转换器 (gpt) 为代表的、基于万亿数量级参数和训练集的生成性大语言模型,正逐步取代传统的自然语言处理工具。gpt-4在阅读理解、代码等领域展现出与常人和本文档来自技高网...

【技术保护点】

1.一种基于语义理解的晶体材料结构生成方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于语义理解的晶体材料结构生成方法,其特征在于,所述大语言模型为GPT-4,所述结构化数据以JSON格式输出,用于后续步骤的查询参数解析。

3.如权利要求1所述的基于语义理解的晶体材料结构生成方法,其特征在于,步骤S1具体包括:

4.如权利要求1所述的基于语义理解的晶体材料结构生成方法,其特征在于,步骤S2具体包括:

5.如权利要求1所述的基于语义理解的晶体材料结构生成方法,其特征在于,步骤S3具体包括:

6.如权利要求5所述的基于语义...

【技术特征摘要】

1.一种基于语义理解的晶体材料结构生成方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于语义理解的晶体材料结构生成方法,其特征在于,所述大语言模型为gpt-4,所述结构化数据以json格式输出,用于后续步骤的查询参数解析。

3.如权利要求1所述的基于语义理解的晶体材料结构生成方法,其特征在于,步骤s1具体包括:

4.如权利要求1所述的基于语义理解的晶体材料结构生成方法,其特征在于,步骤s2具体包括:

5.如权利要求1所述的基于语义理解的晶体材料结构生成方法,其特征在于,步骤s3具体包括:

6.如权利要求5所述的基于语义...

【专利技术属性】
技术研发人员:侯廷政张翔李佳贺艳兵米金硕康飞宇
申请(专利权)人:清华大学深圳国际研究生院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1