【技术实现步骤摘要】
本公开实施例涉及机器学习,尤其涉及一种通过分类模型添加分类标签的方法、装置、设备和介质。
技术介绍
1、随着数字技术的发展,形成了海量规模的例如多种模态的数据。面对庞大的数据规模,难以通过人工方式对这些数据进行分类。因此,通过机器学习进行数据分类是很多应用中常见的任务。而这些数据常常是可以属于多种类别的,也就是说可以具有多种类别的分类标签,现有的多分类的分类模型的训练方案,通常依赖于具有全量的类别分类标签的数据进行训练。但是,现实中标记了完整的类别分类标签的数据常常是难以获得的,很多数据只具有部分类别的标签。因此,现有的多分类的分类模型训练中常常丢弃只具有部分类别标签的数据,而仅采用具有全量的类别分类标签的数据进行训练。造成了分类模型的训练数据欠缺,因而训练效果不佳的问题,尤其是模型的分类准确率低和泛化性差的问题。
技术实现思路
1、本公开实施例描述了一种通过分类模型添加分类标签的方法、装置、设备和介质。
2、根据第一方面,提供了一种通过分类模型添加分类标签的方法,所述分类模型
...【技术保护点】
1.一种通过分类模型添加分类标签的方法,所述分类模型中包括与预定数量的类别对应的预定数量的分类器,所述方法包括:
2.根据权利要求1所述的方法,还包括:
3.根据权利要求1所述的方法,其中,所述第一批次样本中还包括多个全标签样本,所述全标签样本具有预定数量的类别的分类标签;
4.根据权利要求1所述的方法,其中,基于更新后的预定数量的分类器,向第二批次样本中包括的半标签样本添加缺失的分类标签,包括:
5.根据权利要求2所述的方法,其中,基于添加缺失的分类标签后的第二批次样本中的半标签样本,重新训练所述分类模型;
【技术特征摘要】
1.一种通过分类模型添加分类标签的方法,所述分类模型中包括与预定数量的类别对应的预定数量的分类器,所述方法包括:
2.根据权利要求1所述的方法,还包括:
3.根据权利要求1所述的方法,其中,所述第一批次样本中还包括多个全标签样本,所述全标签样本具有预定数量的类别的分类标签;
4.根据权利要求1所述的方法,其中,基于更新后的预定数量的分类器,向第二批次样本中包括的半标签样本添加缺失的分类标签,包括:
5.根据权利要求2所述的方法,其中,基于添加缺失的分类标签后的第二批次样本中的半标签样本,重新训练所述分类模型;
6.根据权利要求1所述的方法,其中,
7.根据权利要求1所述的方法,其中,所述半标签样本包括多个模态数据;所述特征提取网络包括多个子特征提取网络;所述通过...
【专利技术属性】
技术研发人员:刘瑄,蔡聪怀,万明阳,马国俊,
申请(专利权)人:北京字跳网络技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。