一种深度学习的新型训练策略制造技术

技术编号:24094016 阅读:33 留言:0更新日期:2020-05-09 09:24
本发明专利技术公开了一种深度学习的新型训练策略,收集跨域的测试数据训练模型,并根据模型预测测试集的准确率,将有监督学习和伪标签学习有效的结合起来,较大的提升了网络的泛化能力,使用训练得到的模型来对跨域的未标注的数据进行预测,生成伪标签,辅助人工标注,提升了人工标注的效率。

A new training strategy of deep learning

【技术实现步骤摘要】
一种深度学习的新型训练策略
本专利技术涉及深度学习
,特别是指一种深度学习的新型训练策略。
技术介绍
大数据时代,每天都会产生巨量的数据,但是这些数据都是杂乱无章的,如果人工对这些数据进行总结和分析,不仅耗时耗力,而且结果很差。因此希望训练人工智能,让机器具有分析、总结甚至推理的能力,代替人类完成一些任务。训练数据是深度学习中最重要的环节之一。标注训练数据需要大量的时间和人力,因此深度学习逐渐从有监督学习向伪标签、半监督学习、无监督学习发展。某些深度学习模型在特定的数据域上有良好的表现,换一个数据域后,准确率则大幅下降,因此出现了很多防止模型过拟合,提升模型泛化能力的策略。例如:使用有监督学习和无监督学习结合的学习策略、使用dropout策略,使用权重正则化策略等。1、有监督学习:通俗的来讲,就是需要人工对数据进行标注。监督学习的训练集要求包括输入输出,也可以说是特征和目标。训练集中的目标是由人标注的。监督学习通过已有的训练样本(即已知数据及其对应的输出)去训练得到一个最优模型(这个模型属于某个函数的集合,最优表示某个评价本文档来自技高网...

【技术保护点】
1.一种深度学习的新型训练策略,其特征在于,具体包括以下步骤:/n步骤1,从图像数据集中随机抽取多类别,获取与上述类别对应的在图像数据集之外的图片,组成数据集;/n步骤2,将数据集按比例分为训练集data_0和测试集data_1,将训练集输入深度神经网络,得到模型model_0;/n步骤3,使用模型model_0预测测试集data_1中的样本,计算预测结果和真实结果之间的差异,得到预测的准确率acc_0,记录预测得到的测试集data_1中样本的伪标签;/n步骤4,将训练集data_0和带有伪标签的样本数据合并记为训练集data_2,训练集data_2输入深度神经网络,每次训练后测试模型mode...

【技术特征摘要】
1.一种深度学习的新型训练策略,其特征在于,具体包括以下步骤:
步骤1,从图像数据集中随机抽取多类别,获取与上述类别对应的在图像数据集之外的图片,组成数据集;
步骤2,将数据集按比例分为训练集data_0和测试集data_1,将训练集输入深度神经网络,得到模型model_0;
步骤3,使用模型model_0预测测试集data_1中的样本,计算预测结果和真实结果之间的差异,得到预测的准确率acc_0,记录预测得到的测试集data_1中样本的伪标签;
步骤4,将训练集data_0和带有伪标签的样本数据合并记为训练集data_2,训练集data_2输入深度神经网络,每次训练后测试模型model_0针对测试集data_1的准确率;
步骤5,若准确率连续n次小于准确率acc_0,则将准确率acc_0更新为n次准确率的平均值,从测试集data_1中取出10%的数据及其真实标签合并到训练集data_0中,重复步骤4;
步骤6,若准确率连续n次大于准确率acc_0,则将准确率acc_0更新为n次准确率的平均值,记录n次准确率中最高一次对应的模型为model_1,从训练集data_0中拿出10%的数据放入测试集data_1中,用模型model_1预测测试集data_1的伪标签,更新测试集data_1的伪标签,重复步骤4;
步骤7,若训练集data_0中的数据全部移至测试集data_1后,经过5次训练后停止训练;或者训练集data_0和测试集data_1处于平衡状态后停止训练。


2.根据权利要求1所述的一种深度学...

【专利技术属性】
技术研发人员:代笃伟赵威申建虎王博张伟
申请(专利权)人:北京精诊医疗科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1