当前位置: 首页 > 专利查询>上海大学专利>正文

一种基于检索参数代理的高分子材料表征转换方法技术

技术编号:41583406 阅读:17 留言:0更新日期:2024-06-06 23:58
本发明专利技术揭示了一种基于检索参数代理的高分子材料表征转换方法,包括:定义测试数据集、大语言模型、提示工程模版、校准器、摩根指纹相似度、bge相似度;针对测试数据集中的每一个输入,遍历知识库中的每一个示例样本,计算其与输入之间的相似度;将输入送入检索参数代理从而生成检索数量;将相似度进行排序,根据上一步的检索数量,从中选取相似度最高的几个示例样本;输入和示例样本一同被嵌入提示工程模版得到完整输入;将完整输入送入大语言模型进行推理并由校准器对输出进行校准得到最终输出。本发明专利技术实现了检索参数代理的高分子材料表征转换方法在高分子材料的应用,极大地增强了材料上下文表征空间,提高表征转换的性能并减少总检索量。

【技术实现步骤摘要】

本专利技术涉及一种基于检索参数代理的高分子材料表征转换方法,属于材料和计算机领域。


技术介绍

1、高分子材料表征转换指实现smiles分子式和高分子材料描述文本之间的互相转换。这极大的缩短了高分子材料发现的流程,还提高了转换性能和数据利用率。传统的高分子材料表征转换方法是基于预训练加微调的方式,即先预训练一个在高分子材料表征领域的专业模型,然后用表征转换任务进一步微调。

2、然而,这类方法存在材料表征空间有限,耗费计算资源以及泛化性低等问题。进一步地,一种基于检索增强生成的高分子材料表征转换方法被提出,其以大语言模型为基础模型,以检索增强生成为核心技术来实现表征转换。具体的,检索增强生成为原始输入提供了一定数量的示例样本,从而实现表征转换。该方法突破了预训练加微调的范式,增强了材料表征空间,减少计算资源的同时提升了泛化性。然而,检索增强生成为不同的输入提供了相同数量的示例样本,这意味着不同的输入样本拥有类似的上下文材料表征空间。

3、智能代理是大语言模型的衍生技术,该技术驱动大语言模型根据环境自适应生成决策参数,在解决复杂问题时取得本文档来自技高网...

【技术保护点】

1.一种基于检索参数代理的高分子材料表征转换方法,其特征在于,具体包括以下步骤:

2.根据权利要求1所述的一种基于检索参数代理的高分子材料表征转换方法,其特征在于,所述步骤S200中,若当前任务是分子生成任务,即由高分子材料描述文本生成SMILES分子式,输入x表示的是高分子材料描述文本;若当前任务是分子概括任务,即由SMILES分子式生成高分子材料描述文本,输入x表示的是SMIELS分子式。

3.根据权利要求2所述的一种基于检索参数代理的高分子材料表征转换方法,其特征在于,所述步骤S200中当输入x表示的是SMILES分子式时,步骤S200具体包括以下步骤:...

【技术特征摘要】

1.一种基于检索参数代理的高分子材料表征转换方法,其特征在于,具体包括以下步骤:

2.根据权利要求1所述的一种基于检索参数代理的高分子材料表征转换方法,其特征在于,所述步骤s200中,若当前任务是分子生成任务,即由高分子材料描述文本生成smiles分子式,输入x表示的是高分子材料描述文本;若当前任务是分子概括任务,即由smiles分子式生成高分子材料描述文本,输入x表示的是smiels分子式。

3.根据权利要求2所述的一种基于检索参数代理的高分子材料表征转换方法,其特征在于,所述步骤s200中当输入x表示的是smiles分子式时,步骤s200具体包括以下步骤:

4.根据权利要求3所述的一种基于检索参数代理的高分子材料表征转换方法,其特征在于,所述步骤s200中当输入x表示的是高分子材料描述文本时,步骤s200中的以下步骤将被替换:

5.根据权利要求3所述的一种基于检索参数代理的高分子材料表征转换方法,其特征在于,所述步骤s202中,摩根指纹会先将smiles分子式转换问指纹向量,并使用dice相似度得到摩根指纹相似度,如下式所示:

6.根据权利要求3所述的一种基于检索参数代理的高分子材料表征转换方法,其特征在于,所述步骤s204中,bge是一个中英文语义向量模型,可将各种数据分子描述文本转化为向量,并使用向量之间的距离来衡量数据之间的相似度。

7.根据权利要...

【专利技术属性】
技术研发人员:武星
申请(专利权)人:上海大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1