标签分类、装置、电子设备及存储介质制造方法及图纸

技术编号:35492810 阅读:23 留言:0更新日期:2022-11-05 16:49
本申请公开了一种标签分类方法、装置、电子设备及存储介质。方法包括:通过标签分类模型对待分类信息进行特征提取,得到隐蔽态特征信息;对隐蔽态特征信息进行矩阵投影处理,得到多个预设标签分别对应的预测概率;将每个预设标签的预测概率以及与每个预设标签对应的最优阈值的进行比对,得到对应每个预设标签的比对结果;根据每个预设标签的比对结果,得到待分类信息的标签分类结果。本申请中,由于不同预设标签对应各自的最优阈值,使得各个预设标签对应的比对结果的准确率较高,从而提高了标签分类结果的准确率。标签分类结果的准确率。标签分类结果的准确率。

【技术实现步骤摘要】
标签分类、装置、电子设备及存储介质


[0001]本申请涉及人工智能
,更具体地,涉及一种标签分类、装置、电子设备及存储介质。

技术介绍

[0002]文本分类是自然语言处理技术(NLP,Natural Language Processing)中的一个重要领域,它的应用也非常广泛,例如垃圾过滤、新闻分类、情感分析、词性标注等等。多标签文本分类属于文本分类的一种,多标签文本分类是指对给定文本进行分类,得到给定文本的分类结果,分类结果包括多个标签,例如一个病人的体检报告,他的分类结果可能包括“高血压”、“高血糖”以及“高血脂”等多个标签。
[0003]多标签文本分类中,可以通过训练获得的神经网络对给定文本进行分类,得到多个标签各自对应的预测概率,然后再通过设定的阈值分别与多个标签各自对应的预测概率比对,确定给定文本所对应的分类结果。但是,采用该分类方法,得到的分类结果准确率普遍较低。

技术实现思路

[0004]有鉴于此,本申请实施例提出了一种标签分类、装置、电子设备及存储介质。
[0005]第一方面,本申请实施例提本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种标签分类方法,其特征在于,所述方法包括:通过标签分类模型对待分类信息进行特征提取,得到隐蔽态特征信息;对所述隐蔽态特征信息进行矩阵投影处理,得到多个预设标签分别对应的预测概率,每个预设标签的预测概率表征所述待分类信息属于每个预设标签的概率;将每个所述预设标签的预测概率以及与每个所述预设标签对应的最优阈值的进行比对,得到对应每个所述预设标签的比对结果,所述多个预设标签各自对应有最优阈值;根据每个所述预设标签的比对结果,得到所述待分类信息的标签分类结果。2.根据权利要求1所述的方法,其特征在于,所述多个预设标签各自对应的最优阈值的获取方法包括:通过所述标签分类模型对样本分类信息进行特征提取,得到样本隐蔽态特征信息;对所述样本隐蔽态特征信息进行矩阵投影处理,得到所述多个预设标签分别对应的样本预测概率,每个预设标签的样本预测概率表征所述样本分类信息属于每个预设标签的概率;根据每个所述预设标签分别对应的样本预测概率,获得每个所述预设标签各自对应的最优阈值。3.根据权利要求2所述的方法,其特征在于,所述根据每个所述预设标签分别对应的样本预测概率,获得每个所述预设标签各自对应的最优阈值,包括:确定对应每个所述预设标签的多个第一阈值以及第一评估指标;根据所述多个第一阈值以及第一评估指标,确定目标阈值,所述确定目标阈值的过程包括:将所述多个第一阈值中的一个第一阈值作为第二阈值,根据所述第二阈值,计算每个所述预设标签对应的第二评估指标;若所述第二评估指标高于所述第一评估指标,将所述第二评估指标作为新的第一评估指标,并将所述第二阈值作为目标阈值;重复所述确定目标阈值的过程,直到遍历所述多个第一阈值,将每个所述预设标签对应的最后一个目标阈值作为每个所述预设标签对应的最优阈值。4.根据权利要求3所述的方法,其特征在于,所述根据所述第二阈值,计算每个所述预设标签对应的第二评估指标,包括:获取所述样本分类信息的标注信息,所述标注信息包括每个所述预设标签对应的标注信息;根据对应每个所述预设标签的第二阈值以及样本预测概率,确定每个所述预设标签的分类结果;根据对应每个所述预设标签的标注信息以及分类结果,得到对应每个所述预设标签的第二评估指标。5...

【专利技术属性】
技术研发人员:王博锐
申请(专利权)人:广州欢聚时代信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1