【技术实现步骤摘要】
分类方法、分类模型的训练方法、装置、设备及存储介质
本公开涉及数学模型
,尤其涉及一种分类方法、分类模型的训练方法、装置、设备及存储介质。
技术介绍
海量标签文本分类,作为文本分类领域的一个重要分支,是从一个非常大的标签集中选择多个相关的标签标记一个给定的文本。该任务有许多实际应用,如商品分类、视频主题、新闻注释、搜索推荐等等。目前,海量标签文本分类算法主要分为四类:one-vs-all方法、基于树的方法、基于向量表征的方法和深度学习方法。但是,相关技术中是基于单个分类模型对待分类数据进行分类,在进行分类的过程中,如果标签数量过多(例如,数万个标签),通过单个的分类模型往往不能获得较为理想的分类结果。
技术实现思路
本公开提供一种分类方法、分类模型的训练方法、装置、设备及存储介质。根据本公开实施例的第一方面,提供一种分类方法,应用于电子设备,包括:基于待分类数据,得到生成器模型输出的第一预测结果;将所述待分类数据输入判别器模型,得到所第二预测结果;基于所述第一 ...
【技术保护点】
1.一种分类方法,其特征在于,应用于电子设备,包括:/n基于待分类数据,得到生成器模型输出的第一预测结果;/n将所述待分类数据输入判别器模型,得到所第二预测结果;/n基于所述第一预测结果和所述第二预测结果,确定所述待分类数据的目标类别。/n
【技术特征摘要】
1.一种分类方法,其特征在于,应用于电子设备,包括:
基于待分类数据,得到生成器模型输出的第一预测结果;
将所述待分类数据输入判别器模型,得到所第二预测结果;
基于所述第一预测结果和所述第二预测结果,确定所述待分类数据的目标类别。
2.根据权利要求1所述的方法,其特征在于,所述第一预测结果包括所述待分类数据在K个类别上的K个第一预测概率;所述第二预测结果包括所述待分类数据在所述K个类别上的K个第二预测概率;
所述基于所述第一预测结果和所述第二预测结果,确定所述待分类数据的目标类别,包括:
基于K个所述第一预测概率和K个所述第二预测概率的乘积,得到K个目标预测概率;
将所述K个目标预测概率,按照从大到小的顺序进行排序;
将排序后的前预设数量个所述目标预测概率所对应的预设数量个类别的类别标签,确定为所述待分类数据的目标标签。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对所述待分类数据进行分词处理,将对所述待分类数据进行分词得到的词语输入所述生成器模型;
基于所述生成器模型对所述待分类数据所包含的词语进行词嵌入处理,得到所述待分类数据中各个词语的词向量。
4.根据权利要求3所述的方法,其特征在于,所述基于待分类数据,得到生成器模型输出的第一预测结果,包括:
利用所述生成器模型,基于所述待分类数据中各个词语的词向量,得到所述待分类数据在K个类别上的K个第一预测概率;
所述将所述待分类数据输入判别器模型,得到所第二预测结果,包括:
利用所述判别器模型,基于所述待分类数据中各个词语的词向量,得到所述待分类数据在所述K个类别上的K个第二预测概率。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述待分类数据的类型包括以下至少之一:图像数据类型、文本数据类型和音频数据类型。
6.根据权利要求1至4任一项所述的方法,其特征在于,所述生成器模型包括Albert模型,所述判别器模型包括Bert模型。
7.一种分类模型的训练方法,其特征在于,用于训练权利要求1至6任一项所述的判别器模型,所述方法包括:
将训练集中的已标注的样本数据输入生成器模型,得到所述样本数据所对应的N个第一预测标签的N个类别概率;其中,每个样本数据对应有至少一个所述第一预测标签;
将所述N个类别概率按照从大到小的顺序排序,从排序后的所述类别概率中确定出前L个所述类别概率;
将前L个所述类别概率所对应的L个所述第一预测标签,确定为构成候选标签集的L个候选标签;其中,所述L和所述N为正整数,且所述L小于所述N;
基于所述样本数据和所述候选标签集,训练所述判别器模型。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
基于所述第一预测标签的总个数以及所述样本数据的个数,确定单个所述样本数据的平均标签个数;
基于所述平均标签个数与第一设定超参数的乘积,得到所述L。
9.根据权利要求7所述的方法,其特征在于,所述方法还包括:
根据所述样本数据的真实标签和所述生成器模型输出的第一预测标签的差异,确定所述生成器模型在所述训练集上的第一损失;
基于所述候选标签和所述判别器模型输出的第二预测标签,确定所述判别器模型在所述候选标签集上的第二损失;
利用第二设定超参数,对所述第一损失和所述第二损失进行加权之后求和,得到训练损失;
基于所述训练损失,更新所述生成器模型和判别器模型的模型参数。
10.一种分类装置,其特征在于,应用于电子设备,包括:
第一获取模块,配置为基于待分类数据,得到生成器模型输出的第一预测结果;
第二获取模块,配置为将所述待分类数据输入判别器模型,得到所第二预测结果;
分类模块,配置为基于所述第一预测结果和所述第二预测结果,确定所述待分类数据的目标类别。
...
【专利技术属性】
技术研发人员:唐可欣,齐保元,孟二利,
申请(专利权)人:北京小米松果电子有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。