基于大语言模型的文本分类方法、装置、介质和电子设备制造方法及图纸

技术编号:41182384 阅读:22 留言:0更新日期:2024-05-07 22:16
本申请公开了一种基于大语言模型的文本分类方法、装置、介质和电子设备,该方法包括:获取待分类的目标文本,并基于所述目标文本从全量标签确定待选择的候选标签;采用大语言模型对所述目标文本进行信息提取,得到所述目标文本的分类依据;采用所述大语言模型基于所述目标文本以及所述目标文本的分类依据对所述目标文本进行分类推理,得到目标文本的分类理由;采用所述大语言模型基于所述目标文本、所述目标文本的分类依据和所述目标文本的分类理由,从所述候选标签中选择与所述目标文本相匹配的目标标签。执行本申请所提供的技术方案,可以实现零样本的文本分类,能够在保证文本分类效果的同时降低文本分类的成本。

【技术实现步骤摘要】

本申请涉及文本分类领域,尤其涉及一种基于大语言模型的文本分类方法、装置、介质和电子设备


技术介绍

1、在当今金融领域,随着信息量激增的互联网时代,大量的金融领域文本数据不断涌现。在这个背景下,文本分类作为信息处理的关键技术之一,扮演着重要角色。文本分类模型可用于对金融领域的文本进行分类,文本分类模型一般采用有监督的学习方法训练得到,然而可以知道的是,有监督的学习方法需要标记样本进行训练,而标记样本往往需要花费大量人力,产生高昂的分类成本。

2、零样本的文本分类是指在不向文本分类模型提供标记样本的情况下,采用文本分类模型进行文本分类,这样有利于降低文本分类成本。然而,零样本情景下完全缺乏用于训练的标记样本,意味着没有可用于模型训练的标记样本,这使得文本分类模型无法直接学习任何类别的特征或模式。在零样本情景下,文本分类模型面临着未知类别的挑战。


技术实现思路

1、本申请提供了一种基于大语言模型的文本分类方法、装置、介质和电子设备,可以达到实现零样本的文本分类,能够在保证文本分类效果的同时降低文本分类本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的文本分类方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述采用大语言模型对所述目标文本进行信息提取,得到所述目标文本的分类依据,包括:

3.根据权利要求1所述的方法,其特征在于,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述采用所述大语言模型基于所述目标文本、所述目标文本的分类依据和所述目标文本的分类理由,从所述候选标签中选择与所述目标文本相匹配的目标标签,包括:

5.根据权利要求1所述的方法,其特征在于,所述基于所述目标文本从全量标签确定待选择的候选标签,包括:...

【技术特征摘要】

1.一种基于大语言模型的文本分类方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述采用大语言模型对所述目标文本进行信息提取,得到所述目标文本的分类依据,包括:

3.根据权利要求1所述的方法,其特征在于,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述采用所述大语言模型基于所述目标文本、所述目标文本的分类依据和所述目标文本的分类理由,从所述候选标签中选择与所述目标文本相匹配的目标标签,包括:

5.根据权利要求1所述的方法,其特征在于,所述基于所述目标文本从全量标签确定待选择的候选标签,包括:

6.根据权利要求5所述的方法,其特征在于,所述基于所述目标文本向量和所述全量标签向量,计算所述目标...

【专利技术属性】
技术研发人员:王建圣张健韩伟徐雪帆穆玉芝马天明沈君宇陈运文
申请(专利权)人:达观数据有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1