机器学习方法、机器学习系统以及非暂态电脑可读取媒体技术方案

技术编号:31230761 阅读:31 留言:0更新日期:2021-12-08 10:02
一种机器学习方法包含下列步骤:(a)取得超参数以及超网络参数的初始值;(b)根据超参数以及超网络参数产生第一分类模型参数,基于第一分类模型参数针对训练样本的分类结果更新超网络参数;(c)根据超参数以及更新后的超网络参数产生第二分类模型参数,基于第二分类模型参数针对验证样本的分类结果更新超参数;以及(d)重复步骤(b)与(c)以更新超网络参数以及超参数。透过自动化调整的资料增强的超参数可以有效提高准确率,降低过度拟合的问题。降低过度拟合的问题。降低过度拟合的问题。

【技术实现步骤摘要】
机器学习方法、机器学习系统以及非暂态电脑可读取媒体


[0001]本公开有关于一种机器学习技术,且特别是有关于具有资料增强功能的机器学习技术。

技术介绍

[0002]在机器视觉领域中,经常会利用到机器学习及神经网络等技术。机器视觉的其中一种重要应用是检测或辨识图片或影像当所包含的物件(例如人脸、车牌等),其可透过特征提取和特征分类来进行物件检测。
[0003]为了正确的检测图片或影像中的物件并提高检测的精准度,通常需要大量的训练资料(例如训练用的输入图片以及相应的分类标签),让负责分类的神经网络能够从训练资料中学习到输入图片与正确的分类标签之间的相关性。实际情况中,要取得足够数量的训练资料以符合精准度需求是有相当难度,各种物件检测的应用经常都面临着训练资料的样本数目不足的问题。

技术实现思路

[0004]本公开的一形态揭露一种机器学习方法,包含:(a)取得一超参数以及一超网络参数的初始值;(b)根据该超参数以及该超网络参数产生一第一分类模型参数,基于该第一分类模型参数针对一训练样本的分类结果更新该超网络参数;(c)根据该超本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种机器学习方法,其特征在于,包含:(a)取得一超参数以及一超网络参数的初始值;(b)根据该超参数以及该超网络参数产生一第一分类模型参数,基于该第一分类模型参数针对一训练样本的分类结果更新该超网络参数;(c)根据该超参数以及更新后的该超网络参数产生一第二分类模型参数,基于该第二分类模型参数针对一验证样本的分类结果更新该超参数;以及(d)重复步骤(b)与(c)以更新该超网络参数以及该超参数。2.如权利要求1所述的机器学习方法,其中步骤(b)包含:(b1)由一资料增强模型基于该超参数对该训练样本进行资料增强产生一增强训练样本;(b2)由一超网络基于该超网络参数将该超参数转换为该第一分类模型参数;(b3)由一分类模型基于该第一分类模型参数对该增强训练样本进行分类产生对应该增强训练样本之一第一预测标签;以及(b4)根据该第一预测标签与该训练样本之一训练标签比较产生之一第一损失更新该超网络参数。3.如权利要求2所述的机器学习方法,其中步骤(b2)包含:由该超网络基于该超网络参数以及多个探索值,将该超参数转换为对应该些探索值的多个探索分类模型参数;其中步骤(b3)包含:由该分类模型基于该多个探索分类模型参数分别形成多个探索分类模型,该多个探索分类模型分别对该增强训练样本进行分类产生对应该增强训练样本的多个第一预测标签;以及其中步骤(b4)包含:根据该多个第一预测标签与该训练样本之该训练标签比较计算与该多个探索分类模型对应的多个第一损失;以及根据该多个探索分类模型以及其对应的该多个第一损失以更新该超网络参数。4.如权利要求3所述的机器学习方法,其中步骤(b4)中:将该多个第一预测标签分别与该训练标签进行一交叉熵计算以得到该多个第一损失。5.如权利要求3所述的机器学习方法,其中该多个探索分类模型每一个各自包含多个神经网络结构层,该多个神经网络结构层分为一第一结构层部分以及接续于该第一结构层部分的一第二结构层部分,用以形成该多个探索分类模型的该多个探索分类模型参数各自包含一第一权重参数内容以及一第二权重参数内容,该第一权重参数内容用以决定该第一结构层部分的运作,该第二权重参数内容用以决定该第二结构层部分的运作。6.如权利要求5所述的机器学习方法,其中该多个探索分类模型的该多个第二结构层部分共享相同的该些第二权重参数内容,该多个第二结构层部分的运作逻辑彼此相同。7.如权利要求5所述的机器学习方法,其中该第一结构层部分包含至少一第一卷积层,该多个探索分类模型各自的该至少一第一卷积层彼此权重参数不同。8.如权利要求5所述的机器学习方法,其中该第二结构层部分包含至少一第二卷积层以及至少一全连接层,该多个探索分类模型各自的该至少一第二卷积层以及该至少一全连
接层彼此权重参数相同。9.如权利要求1所述的机器学习方法,其中步骤(c)包含:(c1)由一超网络基于更新后的该超网络参数将该超参数转换为该第二分类模型参数;(c2)由一分类模型基于该第二分类模型参数对该验证样本进行分类产生对应该验证样本之一第二预测标签;以及(c3)根据该第二预测标签与该验证样本的一验证标签比较产生的一第二损失更新该超参数。10.如权利要求9所述的机器学习方法,其中步骤(c3)中:将该第二预测标签与该验证标签进行一交叉熵计算以得到该第二损失。11.一种机器学习系统,其特征在于,包含:一存储单元,用以储存一超参数以及一超网络参数的初始值;一处理单元,与该存储单元耦接,该处理单元运行一超网络以及一分类模型,该处理单元用以进行下列操作:(a)利用该超网络根据该超参数以及该超网络参数产生一第一分类模型参数,利用该分类模型基于该第一分类模型参数产生一训练样本的分类结果,藉以更新该超网络参数;(b)利用该超网...

【专利技术属性】
技术研发人员:陈智旸张哲瀚张智威
申请(专利权)人:宏达国际电子股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1