面向有标记噪声表观年龄数据库的深度网络迁移学习方法技术

技术编号：19746070 阅读：28 留言：0更新日期：2018-12-12 04:53

本发明专利技术公开了一种面向有标记噪声表观年龄数据库的深度网络迁移学习方法。将表观年龄数据库随机按照预设比例分为两部分，一部分是训练集，另一部分是验证集，训练集所占的比例高于验证集所占的比例。从训练集中随机抽取少量数据，重复n次，得到n个子训练集，训练集中剩下的数据所组成的集合，记为数据集A。根据迁移学习方法，对n个子训练集进行深度学习得到n个分类模型，之后利用n个分类模型去识别数据集A。本发明专利技术公开的面向有标记噪声表观年龄数据库的深度网络迁移学习方法，使得在进行表观年龄数据库减弱标记噪声时得到精准度较高的表观年龄数据库，能够有效减弱标记噪声对于实验结果的影响，使其结果更具可信度。

全部详细技术资料下载

【技术实现步骤摘要】
面向有标记噪声表观年龄数据库的深度网络迁移学习方法
本专利技术涉及一种面向有标记噪声表观年龄数据库的方法，特别是涉及一种面向有标记噪声表观年龄数据库的深度网络迁移学习方法。
技术介绍
一个人的生理年龄是从出生那一刻算起，每度过一年的时光，就要在生理年龄上添加一岁，这表明生理年龄是不会受外界环境影响而发生改变的。但在表观年龄数据库中，这些表观年龄与一个人的修养、责任、阅历和心理是联系在一起的，而每一个人在这些方面表现的程度也有所差异，所以当对一个人的年龄依凭外观做判断的时候，就会产生和生理年龄之间的差距。这里，将由人眼依据外观对人的年龄进行标注得到的数据库称为表观年龄数据库。在进行表观年龄数据标注的过程中，可能是采用一人标注，也可能是采用多人标注，按照少数服从多数的原则，但并不能避免人眼判断出来的年龄与其生理年龄之间误差的出现，这些误差会给有特定用途的年龄数据库带来一定的噪声。这里，把这种误差带来的噪声叫做标记噪声。如果对含有标记噪声的表观年龄数据库不进行一定程度上的处理，那么这样的年龄数据库直接使用的话就会使得到的结果含有一定的误差，精度较低。在数据库领域有很多成熟的数据处理技术，但是，对于上述这种由于人的主观判断因素所造成的数据存在噪声的问题，这些技术并不能解决这项问题。另外，不止在表观年龄数据库中存在标记噪声，在其他方面的数据中依旧有不同程度不同形式的噪声存在，目前没有通用且效果好的方法完全减弱噪声。基于时间或人力的考虑，一般情况下，会假设原始数据本身是纯净的，而忽视原始数据中的噪声问题。在这样的初始假设下，拿这些数据做实验得出的结果毫无疑问是不合格的...

【技术保护点】
1.一种面向有标记噪声表观年龄数据库的深度网络迁移学习方法，其特征在于，具体步骤如下：(1)、将表观年龄数据库随机按照预设比例分为两部分，一部分是训练集，另一部分是验证集，训练集所占的比例大于验证集所占的比例；(2)、从训练集中随机抽取少量数据，重复n次，得到n个子训练集，记为A1、A2、……、An，训练集中剩下的数据所组成的集合，记为数据集A；(3)、根据迁移学习方法，对n个子训练集进行深度学习得到n个分类模型M1、M2、……、Mn，之后利用n个分类模型M1、M2、……、Mn去识别数据集A；(4)、将步骤(3)中识别正确的样本数据从数据集A中移除，加入到对应的分类模型的训练集中，使之变成n个新的数据集；将n个新的数据集进行深度学习得到分类模型M11、M22、……、Mnn，再利用分类模型M11、M22、……、Mnn去识别数据集A；(5)、循环重复进行步骤(4)；(6)、当对数据A的识别准确率上下波动范围为[0,0.01]时，则停止循环过程，反之返回步骤(5)；(7)、停止循环过程后，将数据集A中识别错误的数据认定为数据集B，根据投票法方法对数据集B重新进行标签标注；(8)、将重新标记后...

【技术特征摘要】
1.一种面向有标记噪声表观年龄数据库的深度网络迁移学习方法，其特征在于，具体步骤如下：(1)、将表观年龄数据库随机按照预设比例分为两部分，一部分是训练集，另一部分是验证集，训练集所占的比例大于验证集所占的比例；(2)、从训练集中随机抽取少量数据，重复n次，得到n个子训练集，记为A1、A2、……、An，训练集中剩下的数据所组成的集合，记为数据集A；(3)、根据迁移学习方法，对n个子训练集进行深度学习得到n个分类模型M1、M2、……、Mn，之后利用n个分类模型M1、M2、……、Mn去识别数据集A；(4)、将步骤(3)中识别正确的样本数据从数据集A中移除，加入到对应的分类模型的训练集中，使之变成n个新的数据集；将n个新的数据集进行深度学习得到分类模型M11、M22、……、Mnn，再利用分类模型M11、M22、……、Mnn去识别数据集A；(5)、循环重复进行步骤(4)；(6)、当对数据A的识别准确率上下波动范围为[0,0.01]时，则停止循环过程，反之返回步骤(5)；(7)、停止循环过程后，将数据集A中识别错误的数据认定为数据集B，根据投票法方法对数据集B重新进行标签标注；(8)、将重新标记后的样本数据与n个子训练集中的所有数据重新组合成新的表观年龄数据库。2.根据权利要求1所述的面向有标记噪声表观年龄数据库的深度网络迁移学习方法，其特征在于，所述步骤(3)中的利用n个分类模型M1、M2、……、Mn去识别数据集A的方法，就是n个分类模...

【专利技术属性】
技术研发人员：王结太，
申请(专利权)人：奕通信息科技上海股份有限公司，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人