图像分类、数据分类、模型训练方法、设备及存储介质技术

技术编号:35261044 阅读:18 留言:0更新日期:2022-10-19 10:20
本申请实施例提供一种图像分类、数据分类、模型训练方法、设备及存储介质。在数据分类方法中,用于对数据执行分类操作的分类模型根据正样本数据的正分类标签以负样本数据的负分类标签训练得到。从而模型可在训练阶段学习正分类标签的特征分布以及负分类标签的特征分布,并基于正分类标签的特征分布以及负分类标签的特征分布之间的关系,提升对正分类标签的特征分布的辨识和区分能力。在预测阶段,模型可筛选出与负分类标签匹配的数据,以基于排除法原理降低这部分数据被识别为正分类标签所属类别的概率,并可筛选出与负分类标签不匹配的数据,以提升这部分数据被识别为正分类标签所属类别的概率,从而可极大提升分类模型的分类准确性。分类准确性。分类准确性。

【技术实现步骤摘要】
图像分类、数据分类、模型训练方法、设备及存储介质


[0001]本申请涉及机器学习
,尤其涉及一种图像分类、数据分类、模型训练方法、设备及存储介质。

技术介绍

[0002]分类任务是机器学习领域中的任务之一,分类任务的目标是:基于给定的待分类数据,通过分类模型从预先设定的标签中筛选出与待分类数据匹配的标签。
[0003]其中,分类模型可通过训练数据学习不同标签对应的数据的特征分布情况。在分类模型的训练过程中,可通过数据增强的方法在训练样本中加入部分负样本数据,从而增加训练数据的覆盖面,以增强模型的泛化能力。
[0004]但是,这种训练方式未考虑负样本中的有效信息,从而不利于进一步提升模型的分类性能。因此,有待提出一种新的解决方案。

技术实现思路

[0005]本申请的多个方面提供一种图像分类、数据分类、模型训练方法、设备及存储介质,用以提升分类模型的分类性能。
[0006]本申请实施例提供一种图像分类方法,包括:获取待分类的图像;利用所述分类模型,从预设标签集中确定所述图像对应的预测标签;所述预设标签集,包含正分类标签以及负分类标签;根据所述预测标签,确定所述图像所属的类别;其中,所述分类模型根据分类误差训练得到,所述分类误差根据正样本图像的正分类标签和预测标签之间的误差,以及负样本图像的负分类标签和预测标签之间的误差确定。
[0007]本申请实施例提供一种数据分类方法,包括:获取待分类的数据;利用所述分类模型,从预设标签集中确定所述数据对应的预测标签;所述预设标签集,包含正分类标签以及负分类标签;根据所述预测标签,确定所述数据所属的类别;其中,所述分类模型根据分类误差训练得到,所述分类误差根据正样本数据的正分类标签和预测标签之间的误差,以及负样本数据的负分类标签和预测标签之间的误差确定。
[0008]本申请实施例还提供一种分类模型的训练方法,包括:获取样本数据集,所述样本数据集包括:正样本数据集和负样本数据集;将所述正样本数据集以及所述负样本数据集输入机器学习模型,得到所述正样本数据集中的正样本数据各自的预测标签以及所述负样本数据集中的负样本数据各自的预测标签;根据所述正样本数据集中的正样本数据的正分类标签和预测标签之间的误差,以及所述负样本数据集中的负样本数据的负分类标签和预测标签之间的误差,确定所述机器学习模型的分类误差;根据所述分类误差,对所述机器学习模型中的参数进行调整,直至分类误差满足收敛条件,得到分类模型。
[0009]本申请实施例还提供一种电子设备,包括:存储器和处理器;所述存储器用于存储一条或多条计算机指令;所述处理器用于执行所述一条或多条计算机指令以用于:执行本申请实施例提供的方法中的步骤。
[0010]本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,计算机程序被执行时能够实现本申请实施例提供的方法中的步骤。
[0011]本申请实施例提供的数据分类方法中,用于对数据执行分类操作的分类模型根据正样本数据的正分类标签以负样本数据的负分类标签训练得到。从而模型可在训练阶段学习正分类标签的特征分布以及负分类标签的特征分布,并基于正分类标签的特征分布以及负分类标签的特征分布之间的关系,提升对正分类标签的特征分布的辨识和区分能力。在预测阶段,模型可筛选出与负分类标签匹配的数据,以基于排除法原理降低这部分数据被识别为正分类标签所属类别的概率,并可筛选出与负分类标签不匹配的数据,以提升这部分数据被识别为正分类标签所属类别的概率,从而可极大提升分类模型的分类准确性。
附图说明
[0012]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0013]图1为本申请一示例性实施例提供的数据分类方法的流程示意图;
[0014]图2为本申请一示例性实施例提供的分类模型训练过程的示意图;
[0015]图3为本申请一示例性实施例提供的负分类标签的查询表示意图;
[0016]图4为本申请一示例性实施例提供的图像分类方法的流程示意图;
[0017]图5为本申请一示例性实施例提供的电子设备的结构示意图。
具体实施方式
[0018]为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0019]分类任务是机器学习领域中的任务之一,分类任务的目标是:基于给定的待分类数据,通过分类模型从预先设定的标签中筛选出与待分类数据匹配的标签。其中,分类模型可通过训练数据学习不同标签对应的数据的特征分布情况。在分类模型的训练过程中,可通过数据增强的方法在训练样本中加入部分负样本数据,从而增加训练数据的覆盖面,以增强模型的泛化能力。但是,这种训练方式未考虑负样本中的有效信息,从而不利于进一步提升模型的分类性能。
[0020]针对上述技术问题,在本申请一些实施例中,提供了一种解决方案,以下结合附图,详细说明本申请各实施例提供的技术方案。
[0021]图1为本申请一示例性实施例提供的数据分类方法的流程示意图,如图1所示,该方法包括:
[0022]步骤101、获取待分类的数据。
[0023]步骤102、利用分类模型,从预设标签集中确定该数据对应的预测标签;该预设标签集,包含正分类标签以及负分类标签;其中,该分类模型根据分类误差训练得到,该分类误差根据正样本数据的正分类标签和预测标签之间的误差,以及负样本数据的负分类标签和预测标签之间的误差确定。
[0024]步骤103、根据该预测标签,确定该数据的类别。
[0025]在本实施例中,分类模型可应用在多种分类场景,例如图像分类场景、自然语言处理场景、行为数据分析场景等等。在不同场景中,待分类的数据的实现形态不同。例如,在图像分类场景中,待分类的数据可以为图像;在自然语言处理场景中,待分类的数据可以是文本或者音频;在行为数据分析场景中,待分类的数据可以是用户行为数据,例如用户的点击量数据、用户的网页浏览时长数据等等,不再一一列举。模型应用在不同分类场景时,可采用该分类场景对应的样本图像训练分类模型,具体训练过程将在后续实施例中介绍。
[0026]其中,预设标签集,可包括多个分类标签,该多个分类标签包括预设的正分类标签以及负分类标签。其中,正分类标签指的是预设的待分类类别的标签,正分类标签对应的样本数据可描述为正样本数据。例如,对商品进行分类时,正分类标签可包括预设的商品类别标签。例如,正分类标签可以是手机、平板电脑、游戏机等商品类别标签。负样本标签不是待分类类别的标签,可根据负样本数据进行定义。负样本数据是在分类模型训练过程中为提升样本覆盖广度而增加的样本数据,可为负样本数据定义所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像分类方法,其特征在于,包括:获取待分类的图像;利用所述分类模型,从预设标签集中确定所述图像对应的预测标签;所述预设标签集,包含正分类标签以及负分类标签;根据所述预测标签,确定所述图像所属的类别;其中,所述分类模型根据分类误差训练得到,所述分类误差根据正样本图像的正分类标签和预测标签之间的误差,以及负样本图像的负分类标签和预测标签之间的误差确定。2.一种数据分类方法,其特征在于,包括:获取待分类的数据;利用所述分类模型,从预设标签集中确定所述数据对应的预测标签;所述预设标签集,包含正分类标签以及负分类标签;根据所述预测标签,确定所述数据所属的类别;其中,所述分类模型根据分类误差训练得到,所述分类误差根据正样本数据的正分类标签和预测标签之间的误差,以及负样本数据的负分类标签和预测标签之间的误差确定。3.根据权利要求2所述的方法,其特征在于,还包括:获取样本数据集,所述样本数据集包括:正样本数据集和负样本数据集;将所述正样本数据集以及所述负样本数据集输入机器学习模型,得到所述正样本数据集中的正样本数据各自的预测标签以及所述负样本数据集中的负样本数据各自的预测标签;根据所述正样本数据集中的正样本数据的正分类标签和预测标签之间的误差,以及所述负样本数据集中的负样本数据的负分类标签和预测标签之间的误差,确定所述机器学习模型的分类误差;根据所述分类误差,对所述机器学习模型中的参数进行调整,直至分类误差满足收敛条件,得到所述分类模型。4.根据权利要求3所述的方法,其特征在于,获取正样本数据集以及负样本数据集,包括:获取所述正样本数据集;对所述正样本数据集中不同类别的正样本数据进行融合,得到所述负样本数据集中的负样本数据;所述负样本数据集中,任一负样本数据由所述正样本数据集中的任意多个不同类别的正样本数据融合得到。5.根据权利要求4所述的方法,其特征在于,还包括:在对所述正样本数据集中不同类别的正样本数据进行融合,得到负样本数据集的过程中,获取用于融合得到所述负样本数据的多个正样本数据各自的分类标签;根据所述多个正样本数据各自的分类标签,生成所述负样本数据的负分类标签。6.根据权利要求3所述的方法,其特征在于,根据所述正样本数据集中的正样本数据的正分类标签和预测标签之间的误差,以及所述负样本数据集中的负样本数据...

【专利技术属性】
技术研发人员:许璐邴立东黄非
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1