文本分类方法、装置、电子设备制造方法及图纸

技术编号:40980356 阅读:28 留言:0更新日期:2024-04-18 21:26
本申请公开了一种文本分类方法、装置、电子设备,属于计算机技术领域。所述方法包括:通过对应不同分类维度的至少一个第一分类模型对目标文本进行分类处理,获取每个第一分类模型输出的分类结果;将目标文本与预设的关键词库中的关键词进行匹配,从预设的关键词库中选取与目标文本匹配的关键词;拼接分类结果、关键词和目标文本,得到拼接文本;通过第二分类模型对拼接文本进行分类处理,获取第二分类模型输出的分类结果,作为目标文本的分类结果。本方法由多个无直接相关的分类模型的结果与关键词相结合,在进行目标分类和预测的分类模型中实现多维度决策,提高了单一分类模型在分类任务上的准确率,获得了更准确的文本分类。

【技术实现步骤摘要】

本申请涉及计算机,特别是涉及文本分类方法、装置、电子设备,以及计算机可读存储介质。


技术介绍

1、随着人工智能技术的不断发展,越来越多的生成模型被提出。文本生成大模型不断涌现,为人工智能的发展带来了新的突破,现有的文本生成大模型可以根据用户输入的文本或图片精准的回答用户的大部分问题,拥有较高的使用价值,为各行各业的发展带来了新的动力。为了提升文本生成大模型生成内容的准确性,通常会为大模型增加一个前置分类任务。现有技术中。前置分类任务使用的文本分类算法主要是分为三类:1)基于传统的机器学习方法实现文本分类;2)利用深度学习算法实现文本分类;3)基于深度学习、构建词库等组合实现文本分类。其中,第1种和第2种文本分类方法至少存在运行速度慢、占用cpu资源多的缺陷;第3种文本分类方法需要人工对模型训练数据进行标注以及进行匹配规则设计,需要耗费大量人力和时间,效率低下。

2、可见,现有技术中的文本分类方法仍需要改进。


技术实现思路

1、本申请实施例提供一种文本分类方法、装置、电子设备及存储介质,可以提升分类本文档来自技高网...

【技术保护点】

1.一种文本分类方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述第一分类模型和所述第二分类模型分别通过以下方法训练:

3.根据权利要求1所述的方法,其特征在于,所述预设的关键词库是通过以下方法建立的:

4.根据权利要求3所述的方法,其特征在于,所述对预设数据集中各条原始文本分别进行词汇掩码处理得到掩码文本,并比较所述原始文本的分类结果和所述掩码文本的分类结果,获取所述原始文本中的目标词汇组合,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述原始文本的分类结果、所述原始文本的各所述掩码文本的分类结...

【技术特征摘要】

1.一种文本分类方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述第一分类模型和所述第二分类模型分别通过以下方法训练:

3.根据权利要求1所述的方法,其特征在于,所述预设的关键词库是通过以下方法建立的:

4.根据权利要求3所述的方法,其特征在于,所述对预设数据集中各条原始文本分别进行词汇掩码处理得到掩码文本,并比较所述原始文本的分类结果和所述掩码文本的分类结果,获取所述原始文本中的目标词汇组合,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述原始文本的分类结果、所述原始文本的各所述掩码文本的分类结果,获取掩码处理的目标词汇组合,包括:

6.根据权利要求4所述的方法,其特...

【专利技术属性】
技术研发人员:闫占正任梦星刘迎建彭菲
申请(专利权)人:汉王科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1