一种基于对称交叉复合训练的新型深度学习方法及装置制造方法及图纸

技术编号：38368985 阅读：6 留言：0更新日期：2023-08-05 17:34

本发明专利技术涉及深度学习技术领域，特别涉及一种基于对称交叉复合训练的新型深度学习方法及装置，所述方法具体包括：获取第一样本数据，将所述第一样本数据划分为第一训练集、第一验证集和第一测试集，并将所述第一训练集再划分为第一数据集和第二数据集；将所述第一数据集和所述第二数据集轮流作为训练集和验证集进行对称交叉训练，获得离群样本和真性样本；对所述离群样本和所述真性样本进行复合训练，同时进行输出矫正归类，获得第一最优模型。本发明专利技术通过改变传统深度学习训练方法模式，利用深度学习特征提取的功能来自动地识别和分离在训练集中的离群样本，进一步提高模型性能。进一步提高模型性能。进一步提高模型性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于对称交叉复合训练的新型深度学习方法及装置

[0001]本专利技术涉及深度学习
，特别涉及一种基于对称交叉复合训练的新型深度学习方法及装置。

技术介绍

[0002]得益于深度学习强大的特征提取能力，深度学习在计算机视觉领域展现出色的性能。目前在深度学习中，一般按照传统深度学习训练策略来获得合适的神经网络模型，包括：1)首先将数据集划分为训练集、验证集和测试集；2)然后在训练集上训练深度神经网络，通过梯度优化来获得参数化模型，以及在验证集上选取最优模型；3)最后在测试集上执行特定的任务，比如分类和预测。然而在数据集有限的情况下，训练集中的一些离群样本将会导致神经网络出现过拟合问题，即离群样本导致神经网络过度学习，导致模型的泛化能力降低。对于此问题，学者们已经提出了多种方法，比如软权值共享，Dropout策略，以及当模型作用于验证集上的性能开始变差时立刻停止训练。最后一种方法是利用验证集来避免深度学习模型出现过拟合，从而获得合适的深度学习模型，这种方法虽然能够防止模型性能降低，却没有探讨导致过拟合的离群样本对深度学习网络造成的干扰。

技术实现思路

[0003]本专利技术的目的在于提供一种基于对称交叉复合训练的新型深度学习方法及装置，通过改变传统深度学习训练方法模式，利用深度学习特征提取的功能来自动地识别和分离在训练集中的离群样本，进一步提高模型性能。
[0004]一方面，本专利技术提供了一种基于对称交叉复合训练的新型深度学习方法，所述方法具体包括：
[0005]获取第一样本数据...

【技术保护点】

【技术特征摘要】
1.一种基于对称交叉复合训练的新型深度学习方法，其特征在于，所述方法具体包括：获取第一样本数据，将所述第一样本数据划分为第一训练集、第一验证集和第一测试集，并将所述第一训练集再划分为第一数据集和第二数据集；将所述第一数据集和所述第二数据集轮流作为训练集和验证集进行对称交叉训练，获得离群样本和真性样本，所述离群样本包括第一离群样本和第二离群样本，所述真性样本包括第一真性样本和第二真性样本；对所述离群样本和所述真性样本进行复合训练，同时进行输出矫正归类，获得第一最优模型。2.根据权利要求1所述的方法，其特征在于，所述将所述第一数据集和所述第二数据集轮流作为训练集和验证集进行对称交叉训练，获得离群样本和真性样本，具体包括：将所述第一数据集和所述第二数据集分别作为第二训练集和第二验证集进行训练，分离出第一离群样本和第一真性样本；将所述第二数据集和所述第一数据集分别作为第三训练集和第三验证集进行训练，分离出第二离群样本和第二真性样本。3.根据权利要求2所述的方法，其特征在于，所述将所述第一数据集和所述第二数据集分别作为第二训练集和第二验证集进行训练，分离出第一离群样本和第一真性样本，具体包括：将所述第一数据集确定为第二训练集，将所述第二数据集确定为第二验证集；基于第一神经网络模型训练所述第二训练集，并根据所述第二验证集获得第二最优模型；将所述第二最优模型作用于所述第二训练集，确定第一离群样本和第一真性样本。4.根据权利要求2所述的方法，其特征在于，所述将所述第二数据集和所述第一数据集分别作为第三训练集和第三验证集进行训练，分离出第二离群样本和第二真性样本，具体包括：将所述第二数据集确定为第三训练集，将所述第一数据集确定为第三验证集；基于第二神经网络模型训练所述第三训练集，并根据所述第三验证集获得第三最优模型；将所述第三最优模型作用于所述第三训练集，确定第二离群样本和第二真性样本。5.根...

【专利技术属性】
技术研发人员：王旭，何昭水，林志洁，谈季，苏文青，梁浩，
申请(专利权)人：广东工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人