基于相似计算的大模型零样本文本分类方法及装置制造方法及图纸

技术编号:40966688 阅读:29 留言:0更新日期:2024-04-18 20:47
本发明专利技术公开了一种基于相似计算的大模型零样本文本分类方法及装置。其中,该基于相似计算的大模型零样本文本分类方法包括:构造输入模型的指令数据;使用MLM模型或者生成模型进行待分类文本标签token的表征或者生成;计算待分类文本与正例文本、负例文本标签token的余弦相似度,若与正例更相似,则属于正向分类,反之,则不属于正向分类,决了现有技术中,基于相似计算的零样本文本分类准确性较低的技术问题。

【技术实现步骤摘要】

本专利技术涉及自然语言处理相关领域,具体而言,涉及一种基于相似计算的大模型零样本文本分类方法及装置


技术介绍

1、随着chatgpt的兴起,十亿级甚至更大参数规模的预训练语言模型已经成为学术界和工业界的研究热点,受限于硬件和数据,基于下游单任务(如命名实体识别、关系抽取等)的传统微调已经不再适用,取而代之的是基于多任务多指令数据的指令微调(sft),以此提高大模型的通用指令遵循能力,然后通过调整指令实现其在下游子任务上的泛化,因此,大模型在做下游子任务的适配时,zero-shot(零样本)能力越来越受到关注。文本分类作为应用最广泛的子任务,提高其零样本场景下的分类正确率对于学术研究和工业应用都具有重要意义。

2、目前大模型零样本的文本分类主要分为两种技术路线,一种是基于掩码语言模型(mlm)的pet方法(如glm模型的[mask]模式),一种是基于自回归模型的文本生成方法(如chatgpt)。

3、以上零样本文本分类的方法都需要解码映射到具体的标签token,如正向情感映射为“开心”,负向情感映射为“扫兴”,而事实上预训练语言模型本文档来自技高网...

【技术保护点】

1.一种基于相似计算的大模型零样本文本分类方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述使用预设大模型从所述自然语句中获取正例文本、负例文本、待分类文本的标签token的向量表征,包括:

3.根据权利要求1所述的方法,其特征在于,所述分别计算所述待分类文本与所述正例文本、所述负例文本标签token的余弦相似度,包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所述余弦相似度确定所述零样本文本分类,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述余弦相似度确定所述零样本文本分类,还包括:

...

【技术特征摘要】

1.一种基于相似计算的大模型零样本文本分类方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述使用预设大模型从所述自然语句中获取正例文本、负例文本、待分类文本的标签token的向量表征,包括:

3.根据权利要求1所述的方法,其特征在于,所述分别计算所述待分类文本与所述正例文本、所述负例文本标签token的余弦相似度,包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所述余弦相似度确定所述零样本文本分类,包括:

5.根据权利...

【专利技术属性】
技术研发人员:杨梦诗刘升平梁家恩
申请(专利权)人:云知声智能科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1