【技术实现步骤摘要】
prompt产品的版本管理方法、装置、计算机设备和介质
[0001]本公开的实施例涉及计算机
,具体地,涉及适用于一种
prompt
产品的版本管理方法
、
装置
、
计算机设备和介质
。
技术介绍
[0002]随着大规模预训练语言模型
(Large Language Model
,
LLM)
的快速发展,尤其以
ChatGPT
为代表的可交互
LLM
产品的广泛使用,将交互式的
LLM
嵌入在产品设计中作为一环已经是一个普遍的选择
。
[0003]prompt
是面向
LLM
编程的一个重要组成,是用户与
LLM
交互时的提问模板,其决定了
LLM
与用户输入交互的输出格式与语义准确性,在包含
LLM
的产品开发中,同一个功能的
prompt
迭代也是相对频繁的,目前对于
prompt
产品开发的版本管理还没有相应解决方案
。
技术实现思路
[0004]本文中描述的实施例提供了一种
prompt
产品的版本管理方法
、
装置
、
计算机设备和介质,克服了上述问题
。
[0005]第一方面,根据本公开的内容,提供了一种
prompt
产品的版本管理方法,包括 ...
【技术保护点】
【技术特征摘要】
1.
一种
prompt
产品的版本管理方法,其特征在于,包括:构建测试数据池与应用程序接口
API
调用池,所述测试数据池中包括:多个元数据,每个所述元数据中包括输入数据,所述
API
调用池中包括用于执行多种测试功能操作的
API
组件;基于每个所述元数据,构建一个测试节点;采用所述
API
调用池中的串联
API
组件,基于多个所述测试节点之间的数据衔接关系串联多个所述测试节点,得到测试数据实例,所述测试数据实例用于描述所述
prompt
产品下的一个版本对应的数据实例;采用所述
API
调用池中的测试
API
组件,基于每个所述测试节点之间的数据衔接顺序对所述测试数据实例进行数据测试,得到所述测试节点中每个所述元数据对应的输出数据;采用所述
API
调用池中的打分
API
组件,基于所述测试节点中每个所述元数据对应的输出数据,确定所述测试数据实例的测试得分;基于所述测试数据实例的测试得分,确定所述
prompt
产品符合需求的迭代版本
。2.
根据权利要求1所述的方法,其特征在于,所述采用所述
API
调用池中的打分
API
组件,基于所述测试节点中每个所述元数据对应的输出数据,确定所述测试数据实例的测试得分,包括:获取每个所述测试节点中所述元数据对应的数据测试类型,所述数据测试类型用于描述所述元数据的打分方式,不同所述数据测试类型对应不同打分
API
组件;采用与所述元数据对应的数据测试类型匹配的打分
API
组件,基于每个所述测试节点中所述元数据对应的数据测试类型,确定每个所述元数据对应的打分数据;基于每个所述元数据对应的打分数据,确定所述测试数据实例的测试得分
。3.
根据权利要求2所述的方法,其特征在于,每个所述元数据对应有一个目标期望,在所述测试节点中所述元数据对应的数据测试类型为第一类型时;所述采用与所述元数据对应的数据测试类型匹配的打分
API
组件,基于每个所述测试节点中所述元数据对应的数据测试类型,确定每个所述元数据对应的打分数据,包括:获取每个所述元数据对应的目标期望;采用所述第一类型对应的打分
API
组件,分别基于每个所述元数据对应的目标期望与所述元数据对应的输出数据之间的语义比对,确定每个所述元数据对应的打分数据
。4.
根据权利要求2所述的方法,其特征在于,在所述测试节点中所述元数据对应的数据测试类型为第二类型时;所述采用与所述元数据对应的数据测试类型匹配的打分
API
组件,基于每个所述测试节点中所述元数据对应的数据测试类型,确定每个所述元数据对应的打分数据,包括:分别向所述第二类型对应的打分
API
组件发送每个所述元数据对应的输出数据;响应于所述第二类型对应的打分
API
组件发送的每个所述元数据对应的输出数据的评价得分,确定每个所述元数据对应的打分数据
。5.
根据权利要求4所述的方法,其特征在于,所述基于所述测试数据实例的测试得分,确定所述
prompt
产品符合需求的迭代版本,包括:获取预设得分阈值;在确定出所述测试数据...
【专利技术属性】
技术研发人员:丁鑫栋,梁天明,
申请(专利权)人:特赞上海信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。