数据分类模型训练方法和装置制造方法及图纸

技术编号：15725197 阅读：148 留言：0更新日期：2017-06-29 13:03

本发明专利技术公开了一种数据分类模型训练方法和装置，涉及计算机技术领域。通过先采用类别数较少、类内样本数较多的识别对象通用数据集使分类模型具有初步识别性能，然后采用类别数较多的识别对象实际数据集训练分类模型顶部若干层的参数值，使分类模型适应实际识别场景并达到收敛效果，再采用识别对象实际数据集对分类模型进行整体训练，从而使分类模型能够保证收敛、防止过拟合，确保了数据分类的性能和准确性。

全部详细技术资料下载

【技术实现步骤摘要】
数据分类模型训练方法和装置
本专利技术涉及计算机
，特别涉及一种数据分类模型训练方法和装置。
技术介绍
目前，在图像识别、语音识别、声纹识别等领域，会采用基础的分类网络进行训练得到特征，再进行进一步的分类，通过分类来识别出输入数据所属的人或者语音内容等。以图像识别为例，一般的训练方法为：输入若干图像，每张图像会对应相应的类别标签，神经网络在采用输入的若干图像进行训练后，通过对输出的误差的迭代学习来优化网络参数。最终模型误差收敛于一个较小的区间时，训练完成。传统的深度网络借助这种训练方法，可以在公共的学术数据集上获得较好的识别效果。然而，实际场景中可以获取的数据则与学术数据集有很大的差异。以人脸识别为例，实际场景中可以获取的人脸数据所属的人的数量较多，如50万人左右，而单人的样本数据却比较少，例如只有1～3张。如果使用这种结构的数据集训练神经网络模型，往往很难实现收敛的目标，或者神经网络非常容易过拟合，导致模型的识别率低下，无法达到预期的效果。
技术实现思路
本专利技术实施例所要解决的一个技术问题是：在数据分类过程中，如何避免由分类模型难以收敛和过拟合而导致的分类模型识别率低问题。根据本专利技术实施例的第一个方面，提供一种数据分类模型训练方法，包括：采用识别对象通用数据集对神经网络分类模型各个层的参数值进行训练，获得第一神经网络分类模型；采用识别对象实际数据集对第一神经网络分类模型顶部若干层的参数值进行训练，获得第二神经网络分类模型；再次采用识别对象实际数据集对第二神经网络分类模型各个层的参数值进行训练，获得完成训练的第三神经网络分类模型；其中，识别对象通...
数据分类模型训练方法和装置

【技术保护点】
一种数据分类模型训练方法，其特征在于，包括：采用识别对象通用数据集对神经网络分类模型各个层的参数值进行训练，获得第一神经网络分类模型；采用识别对象实际数据集对第一神经网络分类模型顶部若干层的参数值进行训练，获得第二神经网络分类模型；再次采用所述识别对象实际数据集对第二神经网络分类模型各个层的参数值进行训练，获得完成训练的第三神经网络分类模型；其中，识别对象通用数据集中数据的类别数量小于第一类别数量预设值、类别内的样本数量大于第一类内样本数预设值，识别对象实际数据集中数据的类别数量大于第二类别数量预设值，第一类别数量预设值小于第二类别数量预设值。

【技术特征摘要】
1.一种数据分类模型训练方法，其特征在于，包括：采用识别对象通用数据集对神经网络分类模型各个层的参数值进行训练，获得第一神经网络分类模型；采用识别对象实际数据集对第一神经网络分类模型顶部若干层的参数值进行训练，获得第二神经网络分类模型；再次采用所述识别对象实际数据集对第二神经网络分类模型各个层的参数值进行训练，获得完成训练的第三神经网络分类模型；其中，识别对象通用数据集中数据的类别数量小于第一类别数量预设值、类别内的样本数量大于第一类内样本数预设值，识别对象实际数据集中数据的类别数量大于第二类别数量预设值，第一类别数量预设值小于第二类别数量预设值。2.根据权利要求1所述的方法，其特征在于，所述采用识别对象实际数据集对第一神经网络分类模型顶部若干层的参数值进行训练，获得第二神经网络分类模型包括：采用识别对象实际数据集对第一神经网络分类模型顶部若干层的参数值进行训练和调整，当分类误差小于预设的初步收敛误差时结束调整，获得第二神经网络分类模型；其中，预设的初步收敛误差与标准误差的差大于预设值。3.根据权利要求1或2所述的方法，其特征在于，所述顶部若干层的参数值为最顶层的参数值。4.根据权利要求1所述的方法，其特征在于，在所述采用识别对象通用数据集对神经网络分类模型各个层的参数值进行训练，获得第一神经网络分类模型之前，所述方法还包括：采用多对象通用数据集对神经网络分类模型各个层的参数值进行训练，获得第四神经网络分类模型；所述采用识别对象通用数据集对神经网络分类模型各个层的参数值进行训练，获得第一神经网络分类模型包括：采用识别对象通用数据集对第四神经网络分类模型各个层的参数值进行训练，获得第一神经网络分类模型；其中，多对象通用数据集中数据的类别数量小于第三类别数量预设值、类别内的样本数量大于第三类内样本数预设值，第三类别数量预设值小于第二类别数量预设值。5.根据权利要求4所述的方法，其特征在于，当完成训练的第三神经网络分类模型用于人脸识别时，多对象通用数据集包括人脸图像数据和非人脸图像数据，识别对象通用数据集包括标准的人脸图像数据，识别对象实际数据集包括在神经网络分类模型的应用环境中采集的人脸图像数据；或者，当完成训练的第三神经网络分类模型用于声纹识别时，多对象通用数据集包括人声数据和非人声数据、识别对象通用数据集包括标准的人声数据，识别对象实际数据集为在神经网络分类模型的应用环境中采集的人声数据。6.一种数据分类模型训练装置，其特征在于，包括：通用数据集训练模块，用于采用识别对象通用数据集对神经...

【专利技术属性】
技术研发人员：刘巍，葛彦昊，陈宇，翁志，
申请(专利权)人：北京京东尚科信息技术有限公司，北京京东世纪贸易有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人