训练分类器的方法、装置、电子设备和计算机可读存储介质制造方法及图纸

技术编号:21772803 阅读:40 留言:0更新日期:2019-08-03 21:52
本公开公开了一种训练分类器的方法,其特征在于,包括:获取训练集合,所述训练集合包括第一子集合和第二子集合,所述第一子集合中的数据项目对应第一属性值,所述第二子集合中的数据项目对应第二属性值,所述第一属性值小于所述第二属性值;将所述第二子集合中的第一数量的数据项目对应于所述第一属性值,将所述第一子集合中的第二数量的数据项目对应于所述第二属性值;根据所述训练集合训练分类器。本公开实施例提供的训练分类器的方法、装置、电子设备和计算机可读存储介质,对于分类器的训练集合中的子集合中的数据项目,改变其对应的属性值,使得所述分类器能够输出更加平滑的分类结果。

Methods, devices, electronic devices and computer-readable storage media for training classifiers

【技术实现步骤摘要】
训练分类器的方法、装置、电子设备和计算机可读存储介质
本公开涉及信息处理领域,尤其涉及一种训练分类器的方法、装置、电子设备及计算机可读存储介质。
技术介绍
随着互联网相关技术的进步,与图像相关的应用愈发丰富,例如能够通过对图像的分析自动调整图像的属性以获得不同的显示效果。以较为流行的美颜应用为例,具有美颜功能的应用能够通过分类器对拍摄的人脸图像进行分类并根据分类结果进行矫正。具体而言,业界基于对计算工作量和计算精确度的考量,典型的分类器会将目标类别分为标准偏左类,标准类,标准偏右类共三个类别,每个类别对应有特定的属性值,例如对于根据脸型进行分类的分类器,其标准偏左类对应的脸型属性值例如为0、代表尖脸,标准类对应的脸型属性值例如为1、代表标准脸型,标准偏右类对应的脸型属性值例如为2、代表圆脸,分类器对输入的图像所输出的分类结果包括针对各目标类别的概率分布,其中针对各类别的概率分布的和为1,例如针对前述脸型属性的三个类别的概率分布为(0,0.01,0.99),那么根据该概率分布和各类别对应的脸型属性值可以计算输入图像的脸型属性值的期望为0*0+1*0.01+2*0.99=1.99,从而确定输入图像中的人脸属于标准偏右类即圆脸,进而基于该期望1.99进行“瘦脸”的矫正以实现美颜的功能。由于分类器是通过对大量的数据项目进行训练得到的,为了使分类器的分类结果更加显著,用于训练分类器的数据项目往往是根据目标类别精心挑选的。例如对于前述根据脸型进行分类的分类器,在挑选用于训练分类器的数据项目时,会倾向于挑选具有更尖的脸型的图像标记为标准偏左类(例如将所述图像的属性值标记为0),挑选具有更圆的脸型的图像标记为标准偏右类(例如将所述图像的属性值标记为2),根据这些精心挑选的数据项目所训练出的分类器,其输出的分类结果会更加显著,即分类结果对于某一个目标类别会表现为更高的概率。因此将导致如下问题:由于分类器输出的分类结果更加显著,从而导致基于该分类结果计算的属性值的期望会失真,进而根据该失真的期望进行矫正会导致矫正过度,试想对于输入的图像中的脸型可能属于一种略圆但并不是很圆的脸型,但是分类器很可能给出诸如(0,0.01,0.99)的分类结果,进而基于该分类结果计算出的期望1.99进行“瘦脸”的矫正,导致矫正过度。
技术实现思路
本公开实施例提供训练分类器的方法,装置,电子设备,和计算机可读存储介质,对于分类器的训练集合中的子集合中的数据项目,改变其对应的属性值,使得所述分类器能够输出更加平滑的分类结果。第一方面,本公开实施例提供一种训练分类器的方法,其特征在于,包括:获取训练集合,所述训练集合包括第一子集合和第二子集合,所述第一子集合中的数据项目对应第一属性值,所述第二子集合中的数据项目对应第二属性值,所述第一属性值小于所述第二属性值;将所述第二子集合中的第一数量的数据项目对应于所述第一属性值,将所述第一子集合中的第二数量的数据项目对应于所述第二属性值;根据所述训练集合训练分类器。进一步的,所述第一数量与所述第二数量满足如下关系中的一个:所述第一数量与所述第二数量相等且大于0;所述第一数量与所述第二数量不相等。进一步的,所述训练集合还包括第三子集合,所述第三子集合中的数据项目对应第三属性值,所述第三属性值大于所述第二属性值;在根据所述训练集合训练分类器之前,所述方法还包括:将所述第二子集合中的第三数量的数据项目对应于所述第三属性值,将所述第三子集合中的第四数量的数据项目对应于所述第二属性值。进一步的,所述第三数量与所述第四数量满足如下关系中的一个:所述第三数量与所述第四数量相等且大于0;所述第三数量与所述第四数量不相等。进一步的,所述训练集合中的数据项目包括属性值标签,所述属性值标签用于标记所述数据项目对应的属性值。进一步的,所述分类器输出的分类结果包括与所述训练集合的各子集合一一对应的各分类概率,与所述训练集合的各子集合一一对应的各分类概率的和为1。进一步的,所述训练集合包括的子集合的数据项目分别对应于不同的属性值,在所对应的属性值小于所述第二属性值的子集合中,所述第一子集合对应的第一属性值与所述第二属性值的距离最小。进一步的,所述训练集合包括的子集合的数据项目分别对应于不同的属性值,在所对应的属性值大于所述第二属性值的子集合中,所述第三子集合对应的第三属性值与所述第二属性值的距离最小。第二方面,本公开实施例提供一种训练分类器的装置,其特征在于,包括:获取模块,用于获取训练集合,所述训练集合包括第一子集合和第二子集合,所述第一子集合的数据项目对应第一属性值,所述第二子集合的数据项目对应第二属性值,所述第一属性值小于所述第二属性值;属性值对应模块,用于将所述第二子集合中的第一数量的数据项目对应于所述第一属性值,还用于将所述第一子集合中的第二数量的数据项目对应于所述第二属性值;训练模块,用于根据所述训练集合训练分类器。进一步的,所述第一数量与所述第二数量满足如下关系中的一个:所述第一数量与所述第二数量相等且大于0;所述第一数量与所述第二数量不相等。进一步的,所述训练集合还包括第三子集合,所述第三子集合中的数据项目对应第三属性值,所述第三属性值大于所述第二属性值;所述属性值对应模块还用于:将所述第二子集合中的第三数量的数据项目对应于所述第三属性值,将所述第三子集合中的第四数量的数据项目对应于所述第二属性值。进一步的,所述第三数量与所述第四数量满足如下关系中的一个:所述第三数量与所述第四数量相等且大于0;所述第三数量与所述第四数量不相等。进一步的,所述训练集合中的数据项目包括属性值标签,所述属性值标签用于标记所述数据项目对应的属性值。进一步的,所述分类器输出的分类结果包括与所述训练集合的各子集合一一对应的各分类概率,与所述训练集合的各子集合一一对应的各分类概率的和为1。进一步的,所述训练集合包括的子集合的数据项目分别对应于不同的属性值,在所对应的属性值小于所述第二属性值的子集合中,所述第一子集合对应的第一属性值与所述第二属性值的距离最小。进一步的,所述训练集合包括的子集合的数据项目分别对应于不同的属性值,在所对应的属性值大于所述第二属性值的子集合中,所述第三子集合对应的第三属性值与所述第二属性值的距离最小。第三方面,本公开实施例提供一种电子设备,包括:存储器,用于存储计算机可读指令;以及与所述存储器耦合的一个或多个处理器,用于运行所述计算机可读指令,使得所述处理器运行时实现前述第一方面中的任一所述训练分类器的方法。第四方面,本公开实施例提供一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,当所述计算机指令被计算机执行时,使得所述计算机执行前述第一方面中的任一所述训练分类器的方法。本公开公开了一种训练分类器的方法、装置、电子设备和计算机可读存储介质。其中所述训练分类器的方法,其特征在于,包括:获取训练集合,所述训练集合包括第一子集合和第二子集合,所述第一子集合中的数据项目对应第一属性值,所述第二子集合中的数据项目对应第二属性值,所述第一属性值小于所述第二属性值;将所述第二子集合中的第一数量的数据项目对应于所述第一属性值,将所述第一子集合中的第二数量的数据项目对应于所述第二属性值;根据所本文档来自技高网
...

【技术保护点】
1.一种训练分类器的方法,其特征在于,包括:获取训练集合,所述训练集合包括第一子集合和第二子集合,所述第一子集合中的数据项目对应第一属性值,所述第二子集合中的数据项目对应第二属性值,所述第一属性值小于所述第二属性值;将所述第二子集合中的第一数量的数据项目对应于所述第一属性值,将所述第一子集合中的第二数量的数据项目对应于所述第二属性值;根据所述训练集合训练分类器。

【技术特征摘要】
1.一种训练分类器的方法,其特征在于,包括:获取训练集合,所述训练集合包括第一子集合和第二子集合,所述第一子集合中的数据项目对应第一属性值,所述第二子集合中的数据项目对应第二属性值,所述第一属性值小于所述第二属性值;将所述第二子集合中的第一数量的数据项目对应于所述第一属性值,将所述第一子集合中的第二数量的数据项目对应于所述第二属性值;根据所述训练集合训练分类器。2.根据权利要求1所述的训练分类器的方法,其特征在于,所述第一数量与所述第二数量满足如下关系中的一个:所述第一数量与所述第二数量相等且大于0;所述第一数量与所述第二数量不相等。3.根据权利要求1所述的训练分类器的方法,其特征在于,所述训练集合还包括第三子集合,所述第三子集合中的数据项目对应第三属性值,所述第三属性值大于所述第二属性值;在根据所述训练集合训练分类器之前,所述方法还包括:将所述第二子集合中的第三数量的数据项目对应于所述第三属性值,将所述第三子集合中的第四数量的数据项目对应于所述第二属性值。4.根据权利要求3所述的训练分类器的方法,其特征在于,所述第三数量与所述第四数量满足如下关系中的一个:所述第三数量与所述第四数量相等且大于0;所述第三数量与所述第四数量不相等。5.根据权利要求1到4中任一所述的训练分类器的方法,其特征在于,所述训练集合中的数据项目包括属性值标签,所述属性值标签用于标记所述数据项目对应的属性值。6.根据权利要求1所述的训练分类器的方法,其特征在于,所述分类器输出的分类结果包括与...

【专利技术属性】
技术研发人员:王诗吟
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1