分类方法技术

技术编号：39658881 阅读：10 留言：0更新日期：2023-12-09 11:27

本公开提供了一种分类方法

全部详细技术资料下载

【技术实现步骤摘要】
分类方法、装置、设备及存储介质

[0001]本公开涉及计算机
，尤其涉及一种分类方法
、
装置
、
设备及存储介质
。

技术介绍

[0002]目前，训练一个特定垂直领域的文本分类器，在数据层面需要满足两个基本条件：第一，明确的分类体系；第二，每一个分类标签下有大量的训练数据
。
[0003]然而在真实的环境中，构建分类体系以及数据集需要消耗大量的知识工程师和数据标注员，人力资源和时间成本较高
。
除此之外，在一些特殊行业领域，由于具有数据保密的需求，工程师除了有对领域的基本描述情况外，无可供参考的分类体系
、
也无任何参考数据，导致文本分类器的准确性低
、
文本分类效果差
。

技术实现思路

[0004]本公开提供了一种分类方法
、
装置
、
设备及存储介质
。
[0005]根据本公开的第一方面，提供了一种分类方法，包括：
[0006]获取待处理文本；
[0007]基于文本分类器处理所述待处理文本，得到与所述待处理文本相对应的类别信息，其中，所述文本分类器为基于分类引导信息和生成式预训练模型生成的分类器，所述生成式预设训练模型用于根据所述分类引导信息，生成训练所述文本分类器所需要的目标分类数据及其对应的标签信息
。
[0008]在本申请一实施中，所述文本分类器的训练过程包括：
[0009]以所述目标分...

【技术保护点】

【技术特征摘要】
1.
一种分类方法，所述方法包括：获取待处理文本；基于文本分类器处理所述待处理文本，得到与所述待处理文本相对应的类别信息，其中，所述文本分类器为基于分类引导信息和生成式预训练模型生成的分类器，所述生成式预设训练模型用于根据所述分类引导信息，生成训练所述文本分类器所需要的目标分类数据及其对应的标签信息
。2.
根据权利要求1所述的方法，其中，所述文本分类器的训练过程包括：以所述目标分类数据作为输入，以所述目标分类数据对应的目标类别信息作为标签信息，训练神经网络，得到所述文本分类器；其中，所述目标分类数据是通过如下方式获得的：获取用户输入的分类引导信息；通过所述生成式预训练模型处理所述分类引导信息，得到目标类别信息；基于所述目标类别信息，通过所述生成式预训练模型生成所述目标类别信息对应的目标分类数据
。3.
根据权利要求2所述的方法，其中，通过所述生成式预训练模型处理所述分类引导信息，得到目标类别信息，包括：以所述分类引导信息作为输入，基于所述生成式预训练模型，得到多个第一子分类信息；根据多个所述第一子分类信息，确定多个第一子分类引导信息；以多个所述第一子分类引导信息作为输入，基于所述生成式预训练模型，得到多个第二子分类信息；多次执行步骤：根据多个所述第
N
‑1子分类信息，确定多个第
N
‑1子分类引导信息，以多个所述第
N
‑1子分类引导信息作为输入，基于所述生成式预训练模型，得到多个第
N
子分类信息；在多个所述第
N
子分类信息满足指定分类条件的情况下，基于多个所述第一子分类信息
、
多个所述第二子分类信息
…
多个所述第
N
‑1子分类信息
、
多个所述第
N
子分类信息，确定类别信息；其中，所述指定分类条件包括：所述第
N
‑1子分类信息与所述第
N
子分类信息的数量相同；或者，所述第
N
子分类信息的数量满足指定数量
。4.
根据权利要求3所述的方法，其中，所述基于所述目标类别信息，通过所述生成式预训练模型生成所述目标类别信息对应的目标分类数据，包括：基于所述类别信息，确定各目标类别信息...

【专利技术属性】
技术研发人员：敬毅民，孟遥，冯勤，
申请(专利权)人：联想北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人