用于训练数据分类模型的方法、电子设备和计算机程序产品技术

技术编号:38197558 阅读:5 留言:0更新日期:2023-07-21 16:35
本公开的实施例涉及一种用于训练数据分类模型的方法、电子设备和计算机程序产品。该方法包括基于多个样本数据被一个数据分类模型分类到相应类别的概率来生成第一训练规则。该方法还包括基于多个样本数据与相应类别的相关度来生成第二训练规则。此外,该方法还包括使用第一训练规则和第二训练规则训练数据分类模型。利用该方法训练数据分类模型,能够提高数据分类模型对数据分类的准确度以及提高对噪声的鲁棒性。高对噪声的鲁棒性。高对噪声的鲁棒性。

【技术实现步骤摘要】
用于训练数据分类模型的方法、电子设备和计算机程序产品


[0001]本公开的各实施例涉及计算机领域,更具体地,涉及人工智能
本公开的各实施例提供了用于训练数据分类模型的方法、电子设备、装置、介质和计算机程序产品。

技术介绍

[0002]随着人工智能技术的发展,出现了各种对数据进行分类的数据分类模型,例如,用于分类图像的神经网络模型。为了提高数据分类模型的准确度,需要大量的训练样本。然而,获取合适的训练样本是困难的,甚至有一些训练样本的标签是错误的(在本文中被称为噪声),反而使得数据分类模型无法将数据分类为正确的类别。因此,需要一种提高数据分类模型的分类准确度和提高对抗噪声的能力的训练数据分类模型的方法。

技术实现思路

[0003]本公开的实施例提供了一种用于训练数据分类模型的方法、电子设备、装置、介质和计算机程序产品。
[0004]在本公开的第一方面中,提供了一种用于训练数据分类模型的方法。该方法包括基于多个样本数据被一个数据分类模型分类到相应类别的概率来生成第一训练规则。该方法还包括基于多个样本数据与相应类别的相关度来生成第二训练规则。此外,该方法还包括使用第一训练规则和第二训练规则训练数据分类模型。
[0005]在本公开的第二方面中,提供了一种电子设备。该电子设备包括处理器以及与处理器耦合的存储器,存储器具有存储于其中的指令,指令在被处理器执行时使设备执行动作。动作包括基于多个样本数据被一个数据分类模型分类到相应类别的概率来生成第一训练规则。动作还包括基于多个样本数据与相应类别的相关度来生成第二训练规则。此外,动作还包括使用第一训练规则和第二训练规则训练数据分类模型。
[0006]在本公开的第三方面中,提供了一种用于训练数据分类模型的装置。该装置包括:第一训练规则生成模块,被配置为基于多个样本数据被一个数据分类模型分类到相应类别的概率来生成第一训练规则。该装置还包括第二训练规则生成模块,被配置为基于多个样本数据与相应类别的相关度来生成第二训练规则。此外,该装置还包括训练模块,被配置为使用第一训练规则和第二训练规则训练数据分类模型。
[0007]在本公开的第四方面中,提供了一种计算机可读存储介质。该计算机可读存储介质上存储有一条或多条计算机指令,其中一条或多条计算机指令被处理器执行以实现根据第一方面所述的方法。
[0008]在本公开的第五方面中,提供了一种计算机程序产品。该计算机程序产品包括一条或多条计算机指令,其中一条或多条计算机指令被处理器执行以实现根据第一方面所述的方法。
[0009]提供
技术实现思路
部分是为了以简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。
技术实现思路
部分无意标识要求保护的主题的关键特征或主要特
征,也无意限制要求保护的主题的范围。
附图说明
[0010]结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标注表示相同或相似的元素,其中:
[0011]图1示出了本公开的实施例能够在其中实现的示例环境的示意图;
[0012]图2示出了根据本公开的某些实施例的用于训练数据分类模型的方法的流程图;
[0013]图3A示出了根据本公开的某些实施例的训练框架的示意性框图;
[0014]图3B示出了根据本公开的某些实施例的训练效果的示意图;
[0015]图4示出了根据本公开的某些实施例的用于训练数据分类模型的装置的框图;以及
[0016]图5示出了可以用来实现根据本公开的某些实施例的示例设备的示意性框图。
[0017]在所有附图中,相同或相似参考数字表示相同或相似元素。
具体实施方式
[0018]下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
[0019]在本文中使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其它明确的和隐含的定义。
[0020]专利技术人注意到,基于神经网络的数据分类模型(例如,深度神经网络(DNN))对数据进行分类的能力较好,并且已经被普通使用。然而,对数据分类模型的训练需要大量的经过标注(例如,标签)的样本数据。这些样本数据的标签的来自可以是人工,也可以是从网络爬取的,所以存在大量的噪声。这些噪声将严重影响数据分类模型的分类性能。同时,大量的噪声可以使得数据分类模型学习大量噪声的特征,从而产生过拟合的现象,使得数据分类模型的性能下降。因此,急需一种训练数据分类模型的方法,以提高数据分类模型的性能以及对噪声的鲁棒性。
[0021]有鉴于此,本公开的方法提供了一种用于提高数据分类模型的性能的训练方法。通过下文描述将会理解,与已知传统方案相比,通过利用多个样本数据被一个数据分类模型分类到相应类别的概率来生成第一训练规则以训练数据分类模型,并且还利用基于多个样本数据与相应类别的相关度来生成第二训练规则以训练数据分类模型。这样,可以使得数据分类模型对数据的分类的准确度提高,并且降低数据分类模型对噪音的敏感度,进而提高数据分类模型对抗噪声的能力。因此,本公开的工作原理和机制上都显著不同于任何已知方法。
[0022]在下文描述中,某些实施例将参考DNN来讨论。但是应当理解,这仅仅是为了更好地理解本公开实施例的原理和思想,而无意以任何方式限制本公开的范围。
[0023]图1示出了本公开的实施例能够在其中实现的示例环境100的示意图。
[0024]在电子设备101处(例如,计算机系统、计算模块、服务器等),获取(例如,接收)样本数据,例如,图1的样本数据102

1、样本数据102

2。样本数据(例如,包括具有被拍摄的各种动物的照片)中包括了数据的特征,这些特征将被DNN提取,并且依据这些被提取的特征将样本数据分类为相应类别(例如,狗的照片、猫的照片)。样本数据并不被限制为图像数据,并且样本数据还可以是文本、语音、视频等数据形式。
[0025]样本数据可以有多个,例如第一个样本数据102

1、第二个样本数据102

2、
……
、第N个样本数据102

N(单独或统一地被称为样本数据102)。
[0026]应当理解,图1中所示的示例环境100仅是示意性的,而无意于限制本公开的范围。示例环境100中还可以包括各种附加的设备、装置和/或模块。而且,图1中所示的模块也仅是示意本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于训练数据分类模型的方法,包括:基于多个样本数据被一个数据分类模型分类到相应类别的概率来生成第一训练规则;基于所述多个样本数据与所述相应类别的相关度来生成第二训练规则;以及使用所述第一训练规则和所述第二训练规则训练所述数据分类模型。2.根据权利要求1所述的方法,还包括:针对所述多个样本数据进行聚类,以在所述多个样本数据中确定位于各个聚类中心的相应的中心样本数据;基于所述中心样本数据与相邻中心样本数据之间的相应距离来生成第三训练规则;以及使用所述第一训练规则、所述第二训练规则和所述第三训练规则训练所述数据分类模型。3.根据权利要求2所述的方法,其中:所述第一训练规则、所述第二训练规则和所述第三训练规则包括对应的第一损失函数、第二损失函数和第三损失函数。4.根据权利要求3所述的方法,其中:训练所述数据分类模型的目标包括使得以下各项的加权和被最小化:所述第一损失函数、所述第二损失函数和所述第三损失函数。5.根据权利要求4所述的方法,其中:所述第一损失函数包括与所述概率相关联的第一参数集合;所述第二损失函数包括与所述相关度相关联的第二参数集合;以及所述第三损失函数包括与所述距离相关联的第三参数集合。6.根据权利要求5所述的方法,还包括:调整所述第一参数集合、所述第二参数集合、或所述第三参数集合中的至少一个参数的值,以使得所述加权和被最小化。7.根据权利要求6所述的方法,还包括通过以下方式使得所述加权和被最小化:调整所述第一参数集合中的至少一个参数,使得所述样本数据被正确分类的所述概率增加;或者调整所述第二参数集合中的至少一个参数,使得所述样本数据与相应的正确类别之间的所述相关度增强;或者调整所述第三参数集合中的至少一个参数,使得所述中心样本数据与所述相邻中心样本数据之间的所述距离更接近。8.一种电子设备,包括:处理器;以及与所述处理器耦合的存储器,所述存储器具有存储于其中的指令,所述指令在被处理器执行时使所述设备执行动作,所述动作包括:基于多个样本数据被一个数据分类模型分类到相应类别的概率来生成第一训练规则;基于所述多个样本数据与所述相应类别的相关度来生成第二训练规则;以及使用所述第一训练规则和所述第二训练规则训练所述数据分类模型。9.根据权利要求8所述的电子设备,所述动作还包括...

【专利技术属性】
技术研发人员:王子嘉杨文彬倪嘉呈贾真
申请(专利权)人:戴尔产品有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1