内容分类方法、装置、电子设备和计算机可读存储介质制造方法及图纸

技术编号:31502003 阅读:29 留言:0更新日期:2021-12-22 23:21
本发明专利技术实施例公开了一种内容分类方法、装置、电子设备和计算机可读存储介质;本发明专利技术实施例在获取待分类内容后,对待分类内容中的文本内容进行特征提取,得到文本内容的文本特征,并对文本特征进行分类,得到待分类内容的至少一个一级分类标签,然后,根据一级分类标签,确定待分类内容的二级分类参数,然后,基于二级分类参数,对文本特征进行分类,得到待分类内容的二级分类标签,最后,根据二级分类标签,对待分类内容进行分类;该方案可以提升内容分类的准确性。容分类的准确性。容分类的准确性。

【技术实现步骤摘要】
内容分类方法、装置、电子设备和计算机可读存储介质


[0001]本专利技术涉及通信
,具体涉及一种内容分类方法、装置、电子设备和计算机可读存储介质。

技术介绍

[0002]近年来,随着互联网技术的飞速发展,出现了海量的内容,为了便于对这些内容进行管理,往往就需要对内容进行分类,分类的类目往往可以包括多个分类层级,比如,可以分为一级和二级,等等。现有的内容分类方法往往采用分类模型对内容进行多分类,直接输出层级最小(即粒度最小)的分类标签,再由结果来回溯其他层级的分类标签,从而完成内容分类。
[0003]在对现有技术的研究和实践过程中,本专利技术的专利技术人发现,对于分类模型来说,类目体系越上层,粒度越粗,但是分类难度会更简单,往往可以获取更大的分类准确率,而直接输出层级最小的分类标签的分类准确率相对也最低,因此,导致内容分类的准确性不足。

技术实现思路

[0004]本专利技术实施例提供一种内容分类方法、装置、电子设备和计算机可读存储介质,可以提高内容分类的准确性。
[0005]一种内容分类方法,包括:
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种内容分类方法,其特征在于,包括:获取待分类内容,所述待分类内容包括文本内容;对所述文本内容进行特征提取,得到所述文本内容的文本特征,并对所述文本特征进行分类,得到所述待分类内容的至少一个一级分类标签;根据所述一级分类标签,确定所述待分类内容的二级分类参数;基于所述二级分类参数,对所述文本特征进行分类,得到所述待分类内容的二级分类标签;根据所述二级分类标签,对所述待分类内容进行分类。2.根据权利要求1所述的内容分类方法,其特征在于,所述对所述文本特征进行分类,得到所述待分类内容的至少一个一级分类标签,包括:采用训练后内容分类模型的一级分类网络对所述文本特征进行归一化处理,得到归一化后文本特征;根据所述归一化后文本特征,确定预设一级分类标签集合对应的概率信息;基于所述概率信息,在所述预设一级分类标签中筛选出所述待分类内容的至少一个一级分类标签。3.根据权利要求1所述的内容分类方法,其特征在于,所述根据所述一级分类标签,确定所述待分类内容的二级分类参数,包括:获取所述训练后内容分类模型中二级分类网络的属性信息;在所述属性信息中识别出每一二级分类网络的网络标识;在所述网络标识中筛选出所述一级分类标签对应的网络标识,得到目标网络标识,并将所述目标网络标识作为所待分类内容的二级分类参数。4.根据权利要求3所述的内容分类方法,其特征在于,所述基于所述二级分类参数,对所述文本特征进行分类,得到所述待分类内容的二级分类标签,包括:根据所述二级分类参数,在所述二级分类网络中筛选出至少一个目标二级分类网络;采用所述目标二级分类网络,对所述文本特征进行分类,得到所述文本特征的分类信息;将所述分类信息进行融合,以得到所述待分类内容的二级分类标签。5.根据权利要求4所述的内容分类方法,其特征在于,所述分类信息包括候选二级分类标签集合和所述候选二级分类标签集合对应的概率分布信息,所述将所述分类信息进行融合,以得到所述待分类内容的二级分类标签,包括:将所述候选二级分类标签集合进行融合,得到所述待分类内容的目标二级分类标签集合;将所述概率分布信息进行融合,得到所述目标二级分类标签集合中每一二级分类标签的分类概率;根据所述分类概率,在所述目标二级分类标签集合中筛选出所述待分类内容的二级分类标签。6.根据权利要求2所述的内容分类方法,其特征在于,所述采用训练后内容分类模型的一级分类网络对所述文本特征进行归一化处理,得到归一化后文本特征之前,还包括:获取内容样本,并对所述内容样本中的文本进行特征提取,得到样本文本特征,所述内
容样本包括标注一级分类标签和二级分类标签的内容;采用预设内容分类模型的一级分类网络对所述样本文本特征进行分类,得到所述内容样本的至少一个预测一级分类标签;采用所述预设内容分类模型中的所述预测一级分类标签对应的二级分类网络对所述文本特征进行分类,得到所述内容样本的预测二级分类标签;根据所述标注一级分类标签和二级分类标签、以及所述预测一级分类标签和预测二级分类标签,对所述预设内容分类模型进行收敛,得到所述训练后内容分类模型。7.根据权利要求6所的内容分类方法,其特征在于,所述根据所述标注一级分类标签和二级分类标签、以及所述预测一级分类标签和预测二级分类标签,对所述预设内容分类模型进行收敛,得到所述训练后内容分类模型,包括:根据标注的一级分类标签和所述预测一级分类标签,确定所述内容样本的一级分类损失信息;基于标注的二级分类标签和所述预测二级分类标...

【专利技术属性】
技术研发人员:黄剑辉
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1