基于大语言模型的文本分类方法及装置制造方法及图纸

技术编号:40512009 阅读:18 留言:0更新日期:2024-03-01 13:27
本申请涉及一种基于大语言模型的文本分类方法、装置、电子设备及计算机可读介质。该方法包括:通过待进行分析的文本和提示模板生成首层输入问题;将所述首层输入问题输入到大语言模型中,生成输出数据;通过所述输出数据和预设多个文本分类标签的相似度为所述文本确定文本分类标签;根据所述文本、所述文本分类标签和确认模板生成次层确认问题;将所述次层确认问题输入到大语言模型中,生成回复数据;在所述回复数据为确认时,根据所述文本分类标签、递归模板生成多层递归问题;将所述多层递归问题输入到大语言模型中,生成递归数据以进行分类。本申请能够准确高效的对文本的语义进行自动化的标注和识别。

【技术实现步骤摘要】

本申请涉及计算机信息处理领域,具体而言,涉及一种基于大语言模型的文本分类方法、装置、电子设备及计算机可读介质。


技术介绍

1、文本分类任务是语义识别中一个关键步骤,文本分类任务是指依据文本中的语义对将文本进行分类的任务,例如,“客服:请问您现在方便吗?用户:不方便。”,将上述文本内容识别为“用户忙”。一般的文本分类任务,是为一段文本指定文本分类标签的过程,文本分类标签挖掘是为一段文本找到适合的标签的过程。

2、大语言模型通常指的是在大规模文本语料上训练、包含百亿级别(或更多)参数的语言模型,旨在理解和生成人类语言。比较有代表性的是openai公司开发的超大语言模型chatgpt,它的基本功能以“文本生成”的方式进行,其参数量巨大,训练成本非常昂贵,训练数据庞大,并且集成了该公司之前的模型成果。虽然它是以“文本生成”方式运行,但是它在机器翻译、阅读理解、句法分析、关系抽取等nlp传统研究方向上,也有十分亮眼的表现。chatgpt作为能力强大的文本生成式模型,它对于文本分类任务也有极强的能力。但是,对于工业界遇到的某个文本分类任务,却无法直接使用c本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的文本分类方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,根据所述文本分类标签、递归模板生成多层递归问题,包括:

3.如权利要求2所述的方法,其特征在于,根据所述文本分类标签、所述递归模板中的挖掘模板生成多层挖掘问题,包括:

4.如权利要求1所述的方法,其特征在于,根据文本分类标签、所述递归数据对所述文本进行分类,包括:

5.如权利要求1所述的方法,其特征在于,还包括:

6.如权利要求1所述的方法,其特征在于,通过待进行分析的文本和提示模板生成首层输入问题,包括:>

7.如权利要...

【技术特征摘要】

1.一种基于大语言模型的文本分类方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,根据所述文本分类标签、递归模板生成多层递归问题,包括:

3.如权利要求2所述的方法,其特征在于,根据所述文本分类标签、所述递归模板中的挖掘模板生成多层挖掘问题,包括:

4.如权利要求1所述的方法,其特征在于,根据文本分类标签、所述递归数据对所述文本进行分类,包括:

5.如权利要求1所述的方法,其特征在于,还包括:

6.如权利要求1所述的方法,其特征在于,通过待进行分析的文本和提示模板生成首层输入问题,包括:

7.如权利要求1所述的方法,其特征在于,通过所述输出数据和预设多个文本分类标签的相似度为所述文本确定文本分类标签,包括:

8.如权利要求7所述的方法,...

【专利技术属性】
技术研发人员:马达标费浩峻
申请(专利权)人:北海淇昂信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1