预训练模型提示向量的确定方法、装置及电子设备制造方法及图纸

技术编号:34291975 阅读:22 留言:0更新日期:2022-07-27 09:42
本公开公开了一种预训练模型提示向量的确定方法、装置和电子设备,尤其涉及自然语言处理、深度学习等人工智能技术领域。其中,方案为:获取第一个提示向量及样本数据对应的第一向量;将第一向量与第一个提示向量融合后,输入至预训练模型中,以获取第一个提示向量对应的奖励值;基于奖励值,对第一个提示向量进行修正,以确定第二个提示向量;基于第二个提示向量,返回执行上述获取奖励值的操作,直至确定样本数据对应的目标提示向量。由此,可以基于奖励值对提示向量进行修正,以确定出下一个提示向量,也即通过前向推断,确定目标提示向量,节省了计算资源,同时也节省了确定目标提示向量的时间,提高了效率,为工业化部署提供了条件。了条件。了条件。

【技术实现步骤摘要】
预训练模型提示向量的确定方法、装置及电子设备


[0001]本公开涉及计算机
,具体涉及自然语言处理、深度学习等人工智能
,尤其涉及一种预训练模型提示向量的确定方法、装置、电子设备和存储介质。

技术介绍

[0002]随着计算机技术的发展,自然语言处理应用的也越来越广泛。
[0003]相关技术中,可以通过在预训练模型输入端加一组连续的提示prompt向量,之后在固定预训练模型参数的情况下,利用训练样本对提示向量进行反向传播与优化,以确定最佳的提示向量。通常预训练模型参数可能较大,层数可能较深,涉及的计算量可能较大,从而可能导致计算提示向量的时间过长。由此,如何节省计算提示向量的时间,显得至关重要。

技术实现思路

[0004]本公开提供了一种预训练模型提示向量的确定方法、装置、电子设备和存储介质。
[0005]本公开一方面,提供了一种预训练模型提示向量的确定方法,包括:
[0006]获取第一个提示向量及样本数据对应的第一向量;
[0007]将所述第一向量与所述第一个提示向量融合后,输入至预训练模型中,以获取所述第一个提示向量对应的奖励值;
[0008]基于所述奖励值,对所述第一个提示向量进行修正,以确定第二个提示向量;
[0009]基于所述第二个提示向量,返回执行上述获取奖励值的操作,直至确定所述样本数据对应的目标提示向量。
[0010]本公开的另一方面,提供了一种预训练模型提示向量的确定装置,包括:
[0011]获取模块,用于获取第一个提示向量及样本数据对应的第一向量;
[0012]输入模块,用于将所述第一向量与所述第一个提示向量融合后,输入至预训练模型中,以获取所述第一个提示向量对应的奖励值;
[0013]修正模块,用于基于所述奖励值,对所述第一个提示向量进行修正,以确定第二个提示向量;
[0014]确定模块,用于基于所述第二个提示向量,返回执行上述获取奖励值的操作,直至确定所述样本数据对应的目标提示向量。
[0015]本公开的另一方面,提供了一种电子设备,包括:
[0016]至少一个处理器;以及
[0017]与所述至少一个处理器通信连接的存储器;其中,
[0018]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述一方面实施例所述的预训练模型提示向量的确定方法。
[0019]本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介
质,其上存储有计算机程序,所述计算机指令用于使所述计算机执行上述一方面实施例所述的预训练模型提示向量的确定方法。
[0020]本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述一方面实施例所述的预训练模型提示向量的确定方法。
[0021]本公开提供的预训练模型提示向量的确定方法、装置、电子设备和存储介质,可以先获取第一个提示向量及样本数据对应的第一向量,之后可以将第一向量与第一个提示向量融合后,输入至预训练模型中,以获取第一个提示向量对应的奖励值,再基于奖励值,对第一个提示向量进行修正,以确定第二个提示向量,之后可以基于第二个提示向量,返回执行上述获取奖励值的操作,直至确定样本数据对应的目标提示向量。由此,通过将样本数据对应的第一向量及提示向量融合后,输入至预训练模型中,可以获取对应的奖励值,之后基于奖励值对提示向量进行修正,可以确定出下一个提示向量,之后可以基于新确定出的提示向量,返回继续执行获取奖励值的操作,直至确定出目标提示向量,也即通过前向推断,可以较为快速的确定出目标提示向量,涉及的数据量较少,从而节省了计算资源,同时也节省了确定目标提示向量的时间,提高了效率,为工业化部署提供了条件。
[0022]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0023]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0024]图1为本公开一实施例提供的一种预训练模型提示向量的确定方法的流程示意图;
[0025]图2为本公开一实施例提供的一种预训练模型提示向量的确定方法的流程示意图;
[0026]图3为本公开一实施例提供的一种预训练模型提示向量的确定方法的流程示意图;
[0027]图3A为本公开一实施例提供的一种预训练模型提示向量的确定过程的示意图;
[0028]图4为本公开另一实施例提供的一种预训练模型提示向量的确定装置的结构示意图;
[0029]图5为用来实现本公开实施例的预训练模型提示向量的确定方法的电子设备的框图。
具体实施方式
[0030]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0031]人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技
术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习、深度学习、大数据处理技术、知识图谱技术等几大方向。
[0032]自然语言处理是用计算机来处理、理解以及运用人类语言(如中文、英文等),它是计算机科学与语言学的交叉学科,又常被称为计算语言学。由于自然语言是人类区别于其他动物的根本标志。没有语言,人类的思维也就无从谈起,所以自然语言处理体现了人工智能的最高任务与境界,也就是说,只有当计算机具备了处理自然语言的能力时,机器才算实现了真正的智能。
[0033]深度学习是指多层的人工神经网络和训练它的方法。一层神经网络会把大量矩阵数字作为输入,通过非线性激活方法取权重,再产生另一个数据集合作为输出。通过合适的矩阵数量,多层组织链接一起,形成神经网络“大脑”进行精准复杂的处理,就像人们识别物体标注图片一样。
[0034]下面参考附图描述本公开实施例的预训练模型提示向量的确定方法、装置、电子设备和存储介质。
[0035]本公开实施例的预训练模型提示向量的确定方法,可由本公开实施例提供的预训练模型提示向量的确定装置执行,该装置可配置于电子设备中。
[0036]图1为本公开实施例提供的一种预训练模型提示向量的确定方法的流程示意图。
[0037]如图1所示,该预训练模型提示向量的确定方法,可以包括以下步骤:
[0038]步骤101,获取第一个提示向量及样本数据对应的第一向量本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种预训练模型提示向量的确定方法,其中,包括:获取第一个提示向量及样本数据对应的第一向量;将所述第一向量与所述第一个提示向量融合后,输入至预训练模型中,以获取所述第一个提示向量对应的奖励值;基于所述奖励值,对所述第一个提示向量进行修正,以确定第二个提示向量;基于所述第二个提示向量,返回执行上述获取奖励值的操作,直至确定所述样本数据对应的目标提示向量。2.如权利要求1所述的方法,其中,所述返回执行上述获取奖励值的操作,包括:响应于第N+1个提示向量对应的奖励值为m,其中,N为大于1的正整数,m为实数;获取与所述第N+1个提示向量相邻的前L个提示向量,其中,L为小于或等于N,且大于1的正整数;将所述前L个提示向量进行融合,以获取融合后的向量;基于所述奖励值m对所述融合后的向量进行修正,以生成第N+2个提示向量。3.如权利要求1所述的方法,其中,所述返回执行上述获取奖励值的操作,包括:获取与第N+1个提示向量相邻的前L个提示向量及所述前L个提示向量中每个提示向量对应的奖励值,其中,L为小于或等于N,且大于1的正整数,N为大于1的正整数;基于前L个提示向量中每个所述提示向量对应的奖励值,对每个所述提示向量进行修正,以获取修正后的L个提示向量;将所述修正后的L个提示向量进行融合,以生成第N+2个提示向量。4.如权利要求3所述的方法,其中,所述基于前L个提示向量中每个所述提示向量对应的奖励值,对每个所述提示向量进行修正,以获取修正后的L个提示向量,包括:根据前L个提示向量中每个提示向量对应的奖励值,确定每个所述提示向量对应的权重;基于每个所述提示向量对应的权重,对每个所述提示向量进行修正,以获取修正后的L个提示向量。5.如权利要求1

4中任一所述的方法,其中,所述基于所述第二个提示向量,返回执行上述获取奖励值的操作,直至确定所述样本数据对应的目标提示向量,包括:记录候选提示向量序列,其中,所述候选提示向量序列中每相邻的两个候选提示向量对应的序号值间的差值为K,K为正整数;将验证数据对应的第二向量与候选提示向量融合后,输入至所述预训练模型中,以确定所述验证数据对应的预测标签;基于所述验证数据对应的预测标签与标注标签的差异,确定所述候选提示向量对应的奖励值;将最高奖励值对应的候选提示向量确定为目标提示向量。6.如权利要求5所述的方法,其中,在所述基于所述验证数据对应的预测标签与标注标签的差异,确定所述候选提示向量对应的奖励值之后,还包括:在最高奖励值为多个的情况下,将所述多个最高奖励值中最小序号值对应的候选提示向量,确定为目标提示向量。7.一种预训练模型提示向量的确定装置,其中,所述装置包括:
获取模块,用于获取第一个提示向量及样本数据对应的第一向量;输入模块,用于将所述第一向量与所述第一个提示向量融合后,输入至预训练模型中,以获取所述第一...

【专利技术属性】
技术研发人员:柴业坤王硕寰孙宇
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1