【技术实现步骤摘要】
本专利技术涉及自然语言处理相关领域,具体而言,涉及一种基于相似计算的大模型零样本文本分类方法及装置。
技术介绍
1、随着chatgpt的兴起,十亿级甚至更大参数规模的预训练语言模型已经成为学术界和工业界的研究热点,受限于硬件和数据,基于下游单任务(如命名实体识别、关系抽取等)的传统微调已经不再适用,取而代之的是基于多任务多指令数据的指令微调(sft),以此提高大模型的通用指令遵循能力,然后通过调整指令实现其在下游子任务上的泛化,因此,大模型在做下游子任务的适配时,zero-shot(零样本)能力越来越受到关注。文本分类作为应用最广泛的子任务,提高其零样本场景下的分类正确率对于学术研究和工业应用都具有重要意义。
2、目前大模型零样本的文本分类主要分为两种技术路线,一种是基于掩码语言模型(mlm)的pet方法(如glm模型的[mask]模式),一种是基于自回归模型的文本生成方法(如chatgpt)。
3、以上零样本文本分类的方法都需要解码映射到具体的标签token,如正向情感映射为“开心”,负向情感映射为“扫兴”,而
...【技术保护点】
1.一种基于相似计算的大模型零样本文本分类方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述使用预设大模型从所述自然语句中获取正例文本、负例文本、待分类文本的标签token的向量表征,包括:
3.根据权利要求1所述的方法,其特征在于,所述分别计算所述待分类文本与所述正例文本、所述负例文本标签token的余弦相似度,包括:
4.根据权利要求3所述的方法,其特征在于,所述根据所述余弦相似度确定所述零样本文本分类,包括:
5.根据权利要求4所述的方法,其特征在于,所述根据所述余弦相似度确定所述零样本文本分
...【技术特征摘要】
1.一种基于相似计算的大模型零样本文本分类方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述使用预设大模型从所述自然语句中获取正例文本、负例文本、待分类文本的标签token的向量表征,包括:
3.根据权利要求1所述的方法,其特征在于,所述分别计算所述待分类文本与所述正例文本、所述负例文本标签token的余弦相似度,包括:
4.根据权利要求3所述的方法,其特征在于,所述根据所述余弦相似度确定所述零样本文本分类,包括:
5.根据权利...
【专利技术属性】
技术研发人员:杨梦诗,刘升平,梁家恩,
申请(专利权)人:云知声智能科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。