一种加速机器学习训练的方法技术

技术编号:42303973 阅读:23 留言:0更新日期:2024-08-14 15:51
本发明专利技术公开了一种加速机器学习训练的方法,包括以下步骤:S1、数据收集,收集AI训练数据样本点;S2、旧模型辅助清洗数据,通过旧模型对数据集进行预测,对错误标签或异常数据样本进行识别和排出;S3、旧模型辅助生成伪标签,根据旧模型特征辅助生成数据信息伪标签;S4、数据增强,结合Grad‑CAM++方法分析数据分类重要性;S5、模型训练。本发明专利技术利用旧模型知识辅助生成伪标签,减少了对大量数据进行标记的需求,节省计算资源和计算时间,提高了标签准确性,避免了使用大量相似数据导致的过拟合问题,避免了模型在训练集上表现得过于优秀,但在新的、未见过的数据上表现不好,显著提高了模型泛化能力,提高了AI模型训练的高效性和准确性。

【技术实现步骤摘要】

本专利技术属于机器学习训练方法,具体涉及一种加速机器学习训练的方法


技术介绍

1、机器学习的概念就是通过输入海量训练数据对模型进行训练,使模型掌握数据所蕴含的潜在规律,进而对新输入的数据进行准确的分类或预测,随着人工智能(ai)技术的发展,机器学习训练逐渐也开始向ai训练方向发展,ai训练是通过大量的数据和算法使机器系统学会如何执行特定的任务。

2、目前标准的ai训练方法主要使用大量数据进行机器学习,这些数据在训练时送入到训练模型中,训练模型在每个例子上进行预测,然后根据预测错误的程度调整训练模型的参数,并且,这种训练方法一般使用梯度下降算法优化训练模型的参数。

3、现有技术中的ai训练方法在训练过程中需要对每个数据点进行计算,这样就使得ai训练过程容易受冗余或相似数据点的影响需要大量的计算资源和时间,使用大量冗余或相似数据点进行ai训练可能会导致过拟合,同时,这些数据点主要采用人工审核的方式进行审核,人工数据审核的方式存在着正确率低、数据标记模糊的问题,使得ai训练的高效性与准确性较差。

4、公开于该
技术介绍
部分的信本文档来自技高网
...

【技术保护点】

1.一种加速机器学习训练的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的加速机器学习训练的方法,其特征在于,所述S2具体包括以下步骤:

3.根据权利要求2所述的加速机器学习训练的方法,其特征在于,所述S2还包括:

4.根据权利要求3所述的加速机器学习训练的方法,其特征在于,所述S3具体包括以下步骤:

5.根据权利要求4所述的加速机器学习训练的方法,其特征在于,所述伪标签添加到数据集中用于对数据集进行标记。

6.根据权利要求5所述的加速机器学习训练的方法,其特征在于,所述S4具体包括以下步骤:>

7.根据权利...

【技术特征摘要】

1.一种加速机器学习训练的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的加速机器学习训练的方法,其特征在于,所述s2具体包括以下步骤:

3.根据权利要求2所述的加速机器学习训练的方法,其特征在于,所述s2还包括:

4.根据权利要求3所述的加速机器学习训练的方法,其特征在于,所述s3具体包括以下步骤:

5.根据权利要求4所述的加速机器学习训练的方法,其特征在于,所述伪标签添加到数据集中用于对数据集进行...

【专利技术属性】
技术研发人员:阮书文陈子博
申请(专利权)人:深圳市创智链科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1