一种小样本微调方法、系统及相关装置制造方法及图纸

技术编号:33502468 阅读:21 留言:0更新日期:2022-05-19 01:12
本申请提供一种小样本微调方法,涉及计算机技术领域,包括:输入数据集,按固定模板组成输入样例;构建候选标签词集合和候选prompt模板集合;通过强化学习搜索所述输入样例对应的候选标签词集合中的最佳标签词,和所述输入样例对应的所述候选prompt模板集合中的提示模板;输出所述最佳标签词映射关系以及所述提示模板对应的最佳prompt模板格式。本申请通过构建候选标签词集合,通过选择近义词集合和条件概率集合的交集,缩减候选标签词搜索空间,同时减少不同prompt模板之间的差异性,提高下游任务准确率。本申请还提供一种小样本微调系统、计算机可读存储介质和电子设备,具有上述有益效果。有益效果。有益效果。

【技术实现步骤摘要】
一种小样本微调方法、系统及相关装置


[0001]本申请涉及计算机
,特别涉及一种小样本微调方法、系统及相关装置。

技术介绍

[0002]当前,在下游任务中微调预训练语言模型 (LM)已成为 NLP 领域的通用做法。在标准的“预训练(pre

training)和微调(fine

tuning)”范式中,预训练阶段和下游任务之间的差距可能很大:它们训练目标不同。对于下游任务,通常需要引入新的参数。然而,随着语言模型的日益增大,很难有效地全参数微调预训练模型和新任务相关的参数,但是基于prompt的微调可以使得下游任务采用与预训练目标相同的格式,并且不需要新的参数。
[0003]当prompt模板包含一些训练示例时,预训练的语言模型可以执行许多任务。但是这种类型的小样本学习可能是非常不稳定的:prompt模板格式的选择、训练样本、甚至训练样本顺序都可能导致准确性在接近偶然到接近最先进水平之间漂移,这种不稳定性源于语言模型对预测某些答案的偏差,例如,那些被放在提示语末尾附近的答案,或在预训练数据中常见本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种小样本微调方法,其特征在于,包括:输入数据集,按固定模板组成输入样例;构建候选标签词集合和候选prompt模板集合;通过强化学习搜索所述输入样例对应的候选标签词集合中的最佳标签词,和所述输入样例对应的所述候选prompt模板集合中的提示模板;输出所述最佳标签词映射关系以及所述提示模板对应的最佳prompt模板格式。2.根据权利要求1所述的小样本微调方法,其特征在于,所述输入数据集,按固定模板组成输入样例包括:获取输入内容;将所述输入内容以固定模板表示;计算所述输入内容与训练集中所有样本之间的余弦相似度;从前预设百分比的训练集样本中进行随机采样,得到输入样例。3.根据权利要求1所述的小样本微调方法,其特征在于,构建候选标签词集合和候选prompt模板集合包括:自动化选择最佳候选标签词;自动化选择候选prompt模板。4.根据权利要求3所述的小样本微调方法,其特征在于,所述自动化选择候选标签词包括:初始化词表;采用word2vec方法将所述词表中所有的词向量化,通过余弦相似度确定每个标签对应的近义词集合;通过未经微调的预训练模型,对于训练集中的每一个类别,在所述词表中选择使得条件概率最大的单词,以及包含所述单词的条件概率集合:确定各类别下的候选标签词为所述近义词集合和所述条件概率的几何交集的最大值;综合各类别下的候选标签词,确定令所述训练集正确率最大的分配方式作为最佳候选标签词。5.根据权利要求4所述的小样本微调方法,其特征在于,所述自动化选择候选prompt模板包括:确定所述最佳候选标签词;通过填充占位符生成初始提示模板;所述初始提示模板用于令所述训练集中的输出概率最大;采用集束搜索算法对所述初始提示模板解码得到候选prompt模板。6.根据权利要求5所...

【专利技术属性】
技术研发人员:刘红丽李峰于彤申冲
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1