深度学习分类模型的训练装置和方法制造方法及图纸

技术编号：20589650 阅读：21 留言：0更新日期：2019-03-16 07:23

本发明专利技术实施例提供一种深度学习分类模型的训练装置和方法。所述训练方法包括：为目标数据的目标属性生成多个相关属性以相应地增加多个相关训练分支；基于所述目标数据生成相似数据以相应地增加相似训练分支；针对训练主干、所述相似训练分支和多个所述相关训练分支分别进行训练；以及基于分别训练的结果对特征提取和/或属性分类的参数进行调整。由此，即使在小数据集的情况下，也能够减少或避免深度学习分类模型的过拟合问题。

全部详细技术资料下载

【技术实现步骤摘要】
深度学习分类模型的训练装置和方法
本专利技术实施例涉及信息处理
，尤其涉及一种深度学习(deeplearning)分类模型的训练装置和方法。
技术介绍
随着机器学习方法的不断完善和发展，深度学习方法越来越受到重视。通过深度学习对分类模型进行训练的方法已经应用到许多
，成为图像识别、语音分析等领域的研究热点。一般来说，在对分类模型进行训练时，训练数据越多则深度学习训练的性能越高。但是数据的收集有时候是非常困难的，甚至可能没有足够的数据进行训练，这样可能导致过拟合(overfitting)的问题。如何在小数据集的情况下降低过拟合，对于深度学习分类模型的训练具有重要意义。应该注意，上面对技术背景的介绍只是为了方便对本专利技术的技术方案进行清楚、完整的说明，并方便本领域技术人员的理解而阐述的。不能仅仅因为这些方案在本专利技术的
技术介绍
部分进行了阐述而认为上述技术方案为本领域技术人员所公知。
技术实现思路
本专利技术实施例提供一种深度学习分类模型的训练装置和方法。为目标数据的目标属性生成多个相关属性以相应地增加多个相关训练分支；基于所述目标数据生成相似数据以相应地增加相似训练分支；针对训练主干、所述相似训练分支和多个所述相关训练分支分别进行训练；以及基于分别训练的结果对特征提取和/或属性分类的参数进行调整。由此，即使在小数据集的情况下，也能够减少或避免深度学习分类模型的过拟合问题。根据本专利技术实施例的第一方面，提供了一种深度学习分类模型的训练装置，包括：属性生成单元，其基于目标数据的目标属性生成多个相关属性；其中所述目标数据的目标属性对应一训练主干，所述目...

【技术保护点】
1.一种深度学习分类模型的训练装置，其特征在于，所述训练装置包括：属性生成单元，其基于目标数据的目标属性生成多个相关属性；其中所述目标数据的目标属性对应一训练主干，所述目标数据的所述多个相关属性对应多个相关训练分支；数据生成单元，其基于所述目标数据以及训练数据集生成相似数据；其中所述相似数据的目标属性对应一相似训练分支；训练单元，其针对所述训练主干、所述相似训练分支和多个所述相关训练分支，分别进行包括特征提取和属性分类的训练；以及参数调整单元，其基于分别训练的结果对所述特征提取的参数和/或所述属性分类的参数进行调整，以对整个网络模型进行训练。

【技术特征摘要】
1.一种深度学习分类模型的训练装置，其特征在于，所述训练装置包括：属性生成单元，其基于目标数据的目标属性生成多个相关属性；其中所述目标数据的目标属性对应一训练主干，所述目标数据的所述多个相关属性对应多个相关训练分支；数据生成单元，其基于所述目标数据以及训练数据集生成相似数据；其中所述相似数据的目标属性对应一相似训练分支；训练单元，其针对所述训练主干、所述相似训练分支和多个所述相关训练分支，分别进行包括特征提取和属性分类的训练；以及参数调整单元，其基于分别训练的结果对所述特征提取的参数和/或所述属性分类的参数进行调整，以对整个网络模型进行训练。2.根据权利要求1所述的训练装置，其中，所述属性生成单元通过对所述目标数据增加标注而获得所述多个相关属性；所述数据生成单元通过从所述训练数据集中选择多个样本数据而获得所述相似数据；其中所述相似数据中的一部分样本数据的所述目标属性的值与所述目标数据中的一部分样本数据的所述目标属性的值相同。3.根据权利要求1所述的训练装置，其中，所述训练装置还包括：标签集生成单元，其针对所述训练主干生成一主干标签集，针对多个所述相关训练分支生成多个相关标签集，以及针对所述相似训练分支生成一相似标签集。4.根据权利要求3所述的训练装置，其中，在所述训练主干、所述相似训练分支和所述相关训练分支中，多个所述特征提取共享并使用预先训练得到的一个或多个初始参数。5.根据权利要求3所述的训练装置，其中，所述训练装置还包括：相似度计算单元，其根据所述相似训练分支中的所述属性分类的结果以及所述训练主干中的所述属性分类的结果，计算所述目标数据和所述相似数据关于所述目标属性的相似度。6.根据权利要求5所述的训练装置，其中，所述训练装置还包括：损耗计算单元，其根据所述相似度以及...

【专利技术属性】
技术研发人员：刘晓青，谭志明，
申请(专利权)人：富士通株式会社，
类型：发明
国别省市：日本,JP

全部详细技术资料下载我是这个专利的主人