【技术实现步骤摘要】
本申请涉及计算机,特别是涉及文本分类方法、装置、电子设备,以及计算机可读存储介质。
技术介绍
1、随着人工智能技术的不断发展,越来越多的生成模型被提出。文本生成大模型不断涌现,为人工智能的发展带来了新的突破,现有的文本生成大模型可以根据用户输入的文本或图片精准的回答用户的大部分问题,拥有较高的使用价值,为各行各业的发展带来了新的动力。为了提升文本生成大模型生成内容的准确性,通常会为大模型增加一个前置分类任务。现有技术中。前置分类任务使用的文本分类算法主要是分为三类:1)基于传统的机器学习方法实现文本分类;2)利用深度学习算法实现文本分类;3)基于深度学习、构建词库等组合实现文本分类。其中,第1种和第2种文本分类方法至少存在运行速度慢、占用cpu资源多的缺陷;第3种文本分类方法需要人工对模型训练数据进行标注以及进行匹配规则设计,需要耗费大量人力和时间,效率低下。
2、可见,现有技术中的文本分类方法仍需要改进。
技术实现思路
1、本申请实施例提供一种文本分类方法、装置、电子设备及存
...【技术保护点】
1.一种文本分类方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述第一分类模型和所述第二分类模型分别通过以下方法训练:
3.根据权利要求1所述的方法,其特征在于,所述预设的关键词库是通过以下方法建立的:
4.根据权利要求3所述的方法,其特征在于,所述对预设数据集中各条原始文本分别进行词汇掩码处理得到掩码文本,并比较所述原始文本的分类结果和所述掩码文本的分类结果,获取所述原始文本中的目标词汇组合,包括:
5.根据权利要求4所述的方法,其特征在于,所述根据所述原始文本的分类结果、所述原始文本的各
...【技术特征摘要】
1.一种文本分类方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述第一分类模型和所述第二分类模型分别通过以下方法训练:
3.根据权利要求1所述的方法,其特征在于,所述预设的关键词库是通过以下方法建立的:
4.根据权利要求3所述的方法,其特征在于,所述对预设数据集中各条原始文本分别进行词汇掩码处理得到掩码文本,并比较所述原始文本的分类结果和所述掩码文本的分类结果,获取所述原始文本中的目标词汇组合,包括:
5.根据权利要求4所述的方法,其特征在于,所述根据所述原始文本的分类结果、所述原始文本的各所述掩码文本的分类结果,获取掩码处理的目标词汇组合,包括:
6.根据权利要求4所述的方法,其特...
【专利技术属性】
技术研发人员:闫占正,任梦星,刘迎建,彭菲,
申请(专利权)人:汉王科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。