数据分类模型训练方法和装置制造方法及图纸

技术编号:15725197 阅读:148 留言:0更新日期:2017-06-29 13:03
本发明专利技术公开了一种数据分类模型训练方法和装置,涉及计算机技术领域。通过先采用类别数较少、类内样本数较多的识别对象通用数据集使分类模型具有初步识别性能,然后采用类别数较多的识别对象实际数据集训练分类模型顶部若干层的参数值,使分类模型适应实际识别场景并达到收敛效果,再采用识别对象实际数据集对分类模型进行整体训练,从而使分类模型能够保证收敛、防止过拟合,确保了数据分类的性能和准确性。

【技术实现步骤摘要】
数据分类模型训练方法和装置
本专利技术涉及计算机
,特别涉及一种数据分类模型训练方法和装置。
技术介绍
目前,在图像识别、语音识别、声纹识别等领域,会采用基础的分类网络进行训练得到特征,再进行进一步的分类,通过分类来识别出输入数据所属的人或者语音内容等。以图像识别为例,一般的训练方法为:输入若干图像,每张图像会对应相应的类别标签,神经网络在采用输入的若干图像进行训练后,通过对输出的误差的迭代学习来优化网络参数。最终模型误差收敛于一个较小的区间时,训练完成。传统的深度网络借助这种训练方法,可以在公共的学术数据集上获得较好的识别效果。然而,实际场景中可以获取的数据则与学术数据集有很大的差异。以人脸识别为例,实际场景中可以获取的人脸数据所属的人的数量较多,如50万人左右,而单人的样本数据却比较少,例如只有1~3张。如果使用这种结构的数据集训练神经网络模型,往往很难实现收敛的目标,或者神经网络非常容易过拟合,导致模型的识别率低下,无法达到预期的效果。
技术实现思路
本专利技术实施例所要解决的一个技术问题是:在数据分类过程中,如何避免由分类模型难以收敛和过拟合而导致的分类模型识别率低问题。根据本专利技术实施例的第一个方面,提供一种数据分类模型训练方法,包括:采用识别对象通用数据集对神经网络分类模型各个层的参数值进行训练,获得第一神经网络分类模型;采用识别对象实际数据集对第一神经网络分类模型顶部若干层的参数值进行训练,获得第二神经网络分类模型;再次采用识别对象实际数据集对第二神经网络分类模型各个层的参数值进行训练,获得完成训练的第三神经网络分类模型;其中,识别对象通用数据集中数据的类别数量小于第一类别数量预设值、类别内的样本数量大于第一类内样本数预设值,识别对象实际数据集中数据的类别数量大于第二类别数量预设值,第一类别数量预设值小于第二类别数量预设值。在一个实施例中,采用识别对象实际数据集对第一神经网络分类模型顶部若干层的参数值进行训练,获得第二神经网络分类模型包括:采用识别对象实际数据集对第一神经网络分类模型顶部若干层的参数值进行训练和调整,当分类误差小于预设的初步收敛误差时结束调整,获得第二神经网络分类模型;其中,预设的初步收敛误差与标准误差的差大于预设值。在一个实施例中,顶部若干层的参数值为最顶层的参数值。在一个实施例中,在采用识别对象通用数据集对神经网络分类模型各个层的参数值进行训练,获得第一神经网络分类模型之前,方法还包括:采用多对象通用数据集对神经网络分类模型各个层的参数值进行训练,获得第四神经网络分类模型;采用识别对象通用数据集对神经网络分类模型各个层的参数值进行训练,获得第一神经网络分类模型包括:采用识别对象通用数据集对第四神经网络分类模型各个层的参数值进行训练,获得第一神经网络分类模型;其中,多对象通用数据集中数据的类别数量小于第三类别数量预设值、类别内的样本数量大于第三类内样本数预设值,第三类别数量预设值小于第二类别数量预设值。在一个实施例中,当完成训练的第三神经网络分类模型用于人脸识别时,多对象通用数据集包括人脸图像数据和非人脸图像数据,识别对象通用数据集包括标准的人脸图像数据,识别对象实际数据集包括在神经网络分类模型的应用环境中采集的人脸图像数据;或者,当完成训练的第三神经网络分类模型用于声纹识别时,多对象通用数据集包括人声数据和非人声数据、识别对象通用数据集包括标准的人声数据,识别对象实际数据集为在神经网络分类模型的应用环境中采集的人声数据。根据本专利技术实施例的第二个方面,提供一种数据分类模型训练装置,包括:通用数据集训练模块,用于采用识别对象通用数据集对神经网络分类模型各个层的参数值进行训练,获得第一神经网络分类模型;实际数据集部分训练模块,用于采用识别对象实际数据集对第一神经网络分类模型顶部若干层的参数值进行训练,获得第二神经网络分类模型;实际数据集全局训练模块,用于再次采用识别对象实际数据集对第二神经网络分类模型各个层的参数值进行训练,获得完成训练的第三神经网络分类模型;其中,识别对象通用数据集中数据的类别数量小于第一类别数量预设值、类别内的样本数量大于第一类内样本数预设值,识别对象实际数据集中数据的类别数量大于第二类别数量预设值,第一类别数量预设值小于第二类别数量预设值。在一个实施例中,实际数据集部分训练模块进一步用于采用识别对象实际数据集对第一神经网络分类模型顶部若干层的参数值进行训练和调整,当分类误差小于预设的初步收敛误差时结束调整,获得第二神经网络分类模型;其中,预设的初步收敛误差与标准误差的差大于预设值。在一个实施例中,顶部若干层的参数值为最顶层的参数值。在一个实施例中,装置还包括:多对象数据集训练模块,用于采用多对象通用数据集对神经网络分类模型各个层的参数值进行训练,获得第四神经网络分类模型;通用数据集训练模块进一步用于采用识别对象通用数据集对第四神经网络分类模型各个层的参数值进行训练,获得第一神经网络分类模型;其中,多对象通用数据集中数据的类别数量小于第三类别数量预设值、类别内的样本数量大于第三类内样本数预设值,第三类别数量预设值小于第二类别数量预设值。在一个实施例中,当完成训练的第三神经网络分类模型用于人脸识别时,多对象通用数据集包括人脸图像数据和非人脸图像数据,识别对象通用数据集包括标准的人脸图像数据,识别对象实际数据集包括在神经网络分类模型的应用环境中采集的人脸图像数据;或者,当完成训练的第三神经网络分类模型用于声纹识别时,多对象通用数据集包括人声数据和非人声数据、识别对象通用数据集包括标准的人声数据,识别对象实际数据集为在神经网络分类模型的应用环境中采集的人声数据。根据本专利技术实施例的第三个方面,提供一种数据分类模型训练装置,包括:存储器;以及耦接至存储器的处理器,处理器被配置为基于存储在存储器中的指令,执行前述任意一种数据分类模型训练方法。根据本专利技术实施例的第四个方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述任意一种数据分类模型训练方法。上述专利技术中的一个实施例具有如下优点或有益效果:通过先采用类别数较少、类内样本数较多的识别对象通用数据集使分类模型具有初步识别性能,然后采用类别数较多的识别对象实际数据集训练分类模型顶部若干层的参数值,使分类模型适应实际识别场景并达到收敛效果,再采用识别对象实际数据集对分类模型进行整体训练,从而使分类模型能够保证收敛、防止过拟合,确保了数据分类的性能和准确性。通过以下参照附图对本专利技术的示例性实施例的详细描述,本专利技术的其它特征及其优点将会变得清楚。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术数据分类模型训练方法一个实施例的流程图。图2为本专利技术数据分类模型训练方法另一个实施例的流程图。图3为本专利技术数据分类模型训练装置一个实施例的结构图。图4为本专利技术数据分类模型训练装置另一个实施例的结构图。图5为本专利技术数据分类模型训练装置的又一个实施例的结构图。图6为本专利技术数据分类本文档来自技高网...
数据分类模型训练方法和装置

【技术保护点】
一种数据分类模型训练方法,其特征在于,包括:采用识别对象通用数据集对神经网络分类模型各个层的参数值进行训练,获得第一神经网络分类模型;采用识别对象实际数据集对第一神经网络分类模型顶部若干层的参数值进行训练,获得第二神经网络分类模型;再次采用所述识别对象实际数据集对第二神经网络分类模型各个层的参数值进行训练,获得完成训练的第三神经网络分类模型;其中,识别对象通用数据集中数据的类别数量小于第一类别数量预设值、类别内的样本数量大于第一类内样本数预设值,识别对象实际数据集中数据的类别数量大于第二类别数量预设值,第一类别数量预设值小于第二类别数量预设值。

【技术特征摘要】
1.一种数据分类模型训练方法,其特征在于,包括:采用识别对象通用数据集对神经网络分类模型各个层的参数值进行训练,获得第一神经网络分类模型;采用识别对象实际数据集对第一神经网络分类模型顶部若干层的参数值进行训练,获得第二神经网络分类模型;再次采用所述识别对象实际数据集对第二神经网络分类模型各个层的参数值进行训练,获得完成训练的第三神经网络分类模型;其中,识别对象通用数据集中数据的类别数量小于第一类别数量预设值、类别内的样本数量大于第一类内样本数预设值,识别对象实际数据集中数据的类别数量大于第二类别数量预设值,第一类别数量预设值小于第二类别数量预设值。2.根据权利要求1所述的方法,其特征在于,所述采用识别对象实际数据集对第一神经网络分类模型顶部若干层的参数值进行训练,获得第二神经网络分类模型包括:采用识别对象实际数据集对第一神经网络分类模型顶部若干层的参数值进行训练和调整,当分类误差小于预设的初步收敛误差时结束调整,获得第二神经网络分类模型;其中,预设的初步收敛误差与标准误差的差大于预设值。3.根据权利要求1或2所述的方法,其特征在于,所述顶部若干层的参数值为最顶层的参数值。4.根据权利要求1所述的方法,其特征在于,在所述采用识别对象通用数据集对神经网络分类模型各个层的参数值进行训练,获得第一神经网络分类模型之前,所述方法还包括:采用多对象通用数据集对神经网络分类模型各个层的参数值进行训练,获得第四神经网络分类模型;所述采用识别对象通用数据集对神经网络分类模型各个层的参数值进行训练,获得第一神经网络分类模型包括:采用识别对象通用数据集对第四神经网络分类模型各个层的参数值进行训练,获得第一神经网络分类模型;其中,多对象通用数据集中数据的类别数量小于第三类别数量预设值、类别内的样本数量大于第三类内样本数预设值,第三类别数量预设值小于第二类别数量预设值。5.根据权利要求4所述的方法,其特征在于,当完成训练的第三神经网络分类模型用于人脸识别时,多对象通用数据集包括人脸图像数据和非人脸图像数据,识别对象通用数据集包括标准的人脸图像数据,识别对象实际数据集包括在神经网络分类模型的应用环境中采集的人脸图像数据;或者,当完成训练的第三神经网络分类模型用于声纹识别时,多对象通用数据集包括人声数据和非人声数据、识别对象通用数据集包括标准的人声数据,识别对象实际数据集为在神经网络分类模型的应用环境中采集的人声数据。6.一种数据分类模型训练装置,其特征在于,包括:通用数据集训练模块,用于采用识别对象通用数据集对神经...

【专利技术属性】
技术研发人员:刘巍葛彦昊陈宇翁志
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1