基于主动学习的模型在线增量训练方法、设备及介质技术

技术编号:30145731 阅读:19 留言:0更新日期:2021-09-23 15:19
本申请公开了一种基于主动学习的模型在线增量训练方法、设备及介质,所述基于主动学习的模型在线增量训练方法包括:获取待预测无标签样本,通过故障检测分类模型对所述待预测无标签样本进行预测,获得预测分类结果,并确定所述预测分类结果对应的置信度,其中,所述故障检测分类模型为基于有标签样本集进行迭代训练得到的,若所述置信度满足置信度阈值条件,则将所述待预测无标签样本构建成增量训练样本,基于所述增量训练样本,对所述故障检测分类模型进行在线更新训练,获得更新后的故障检测分类模型。本申请解决因人工标注无标签样本工作量大,导致模型更新训练效率低的技术问题。题。题。

【技术实现步骤摘要】
基于主动学习的模型在线增量训练方法、设备及介质


[0001]本申请涉及机器学习
,尤其涉及一种基于主动学习的模型在线增量训练方法、设备及介质。

技术介绍

[0002]随着工业制造大数据技术的发展,在工业制造过程中,存在大量的无标签数据,而数据驱动的PHM(Prognostic and Health Management ,故障预测与健康管理)模型的训练需要足够丰富的有标签样本,进一步地,当模型部署上线之后,模型更新往往是需要利用新收集的有标签数据对模型进行定期离线更新训练,导致存在大量的无标签样本无法被有效地利用的情况,可通过对无标签样本进行人工标记,从而对模型进行更新训练,然而,人工标注工作量大,需要较长的时间成本,进而导致模型更新训练的效率较低。

技术实现思路

[0003]本申请的主要目的在于提供一种基于主动学习的模型在线增量训练方法、设备及介质,旨在解决现有技术中的因人工标注无标签样本工作量大,导致模型训练更新效率低的技术问题。
[0004]为实现上述目的,本申请提供一种基于主动学习的模型在线增量训练方法,所述基于主动学习的模型在线增量训练方法包括:获取待预测无标签样本;通过故障检测分类模型对所述待预测无标签样本进行预测,获得预测分类结果,并确定所述待预测无标签样本对应的置信度,其中,所述故障检测分类模型为基于有标签样本集进行迭代训练得到的;若所述置信度满足置信度阈值条件,则将所述待预测无标签样本构建成增量训练样本;基于所述增量训练样本,对所述故障检测分类模型进行在线更新训练,获得更新后的故障检测分类模型。
[0005]可选地,所述若所述置信度满足置信度阈值条件,则将所述待预测无标签样本构建成增量训练样本的步骤包括:若所述置信度大于所述置信度阈值,将所述待预测无标签样本设置为关键待标注样本;对所述关键待标注样本进行人工标注,获得所述增量训练样本。
[0006]可选地,所述若所述置信度大于所述置信度阈值,将所述待预测无标签样本设置为关键待标注样本的步骤包括:获取在预设时间窗长内的各已预测样本对应的预测分类结果;分别计算各所述已预测样本分别对应的预测分类结果的均值以及标准差;基于所述均值和所述标准差,若所述置信度大于所述均值和所述标准差之间的运
算结果,则将所述待预测无标签样本设置为所述关键待标注样本。
[0007]可选地,所述基于所述增量训练样本,对所述故障检测分类模型进行在线更新训练,获得更新后的故障检测分类模型的步骤包括:基于所述增量训练样本,利用贝叶斯算法递归计算所述故障检测分类模型对应的参数后验概率分布;基于所述参数后验概率分布,对所述故障检测分类模型进行在线增量更新,获得所述更新后的故障检测分类模型。
[0008]可选地,在所述通过故障检测分类模型对所述待预测无标签样本集进行预测,获得预测分类结果,并确定所述待预测无标签样本集中各待预测无标签样本分别对应的置信度,其中,所述故障检测分类模型为基于有标签样本集进行迭代训练得到的步骤之前,所述基于主动学习的模型在线增量训练方法还包括:获取待训练分类模型;通过所述有标签样本集对所述待训练分类模型进行迭代训练优化,获得所述故障检测分类模型。
[0009]可选地,所述通过所述有标签样本集对所述待训练分类模型进行迭代训练优化,获得所述故障检测分类模型的步骤包括:将所述有标签样本集输入所述待训练分类模型,输出所述有标签样本集中各有标签样本分别对应的分类结果;基于各所述有标签样本分别对应的标签和所述分类结果,计算所述待训练分类模型对应的模型损失;基于所述模型损失,对所述待训练分类模型进行迭代训练,获得所述故障检测分类模型。
[0010]本申请还提供一种基于主动学习的模型在线增量训练装置,所述基于主动学习的模型在线增量训练装置为虚拟装置,所述基于主动学习的模型在线增量训练装置包括:获取模块,用于获取待预测无标签样本;预测模块,用于通过故障检测分类模型对所述待预测无标签样本进行预测,获得预测分类结果,并确定所述待预测无标签样本对应的置信度,其中,所述故障检测分类模型为基于有标签样本集进行迭代训练得到的;构建模块,用于若所述置信度满足置信度阈值条件,则将所述待预测无标签样本构建成增量训练样本;在线更新模块,用于基于所述增量训练样本,对所述故障检测分类模型进行在线更新训练,获得更新后的故障检测分类模型。
[0011]本申请还提供一种基于主动学习的模型在线增量训练设备,所述基于主动学习的模型在线增量训练设备为实体设备,所述基于主动学习的模型在线增量训练设备包括:存储器、处理器以及存储在所述存储器上的基于主动学习的模型在线增量训练程序,所述基于主动学习的模型在线增量训练程序被所述处理器执行实现如上述的基于主动学习的模型在线增量训练方法的步骤。
[0012]本申请还提供一种介质,所述介质为可读存储介质,所述可读存储介质上存储基于主动学习的模型在线增量训练程序,所述基于主动学习的模型在线增量训练程序被处理
器执行实现如上述的基于主动学习的模型在线增量训练方法的步骤。
[0013]本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的基于主动学习的模型在线增量训练方法的步骤。
[0014]本申请提供了一种基于主动学习的模型在线增量训练方法、设备及介质,相比于现有技术采用的通过对大量待预测无标签样本进行人工标注以对模型进行更新训练的技术手段,本申请首先获取待预测无标签样本,进而通过故障检测分类模型对所述待预测无标签样本进行预测,获得预测分类结果,并确定所述预测分类结果对应的置信度,其中,所述故障检测分类模型为基于有标签样本集进行迭代训练得到的,进一步地,若所述置信度满足置信度阈值条件,则将所述待预测无标签样本构建成增量训练样本,进而实现基于所述置信度,有选择性进行选取置信度高的待预测无标签样本以对模型进行更新训练的目的,进一步地,基于所述增量训练样本,对所述故障检测分类模型进行在线更新训练,获得更新后的故障检测分类模型,实现了通过模型主动学习待预测无标签样本,进而将在线的待预测无标签样本构建成增量训练样本,从而对所述故障检测分类模型进行在线更新,既充分地利用了海量的无标签样本,又能实时地通过在线的无标签样本对模型进行更新训练,延长了模型的生命周期,克服了现有技术中大量的无标签样本无法被有效地利用的情况,以及通过对无标签样本进行人工标记以对模型进行更新训练的方法工作量大,需要较长的时间成本,进而导致模型更新训练的效率较低的技术缺陷,从而提高了模型更新训练的效率。
附图说明
[0015]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
[0016]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域默认技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0017]图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于主动学习的模型在线增量训练方法,其特征在于,所述基于主动学习的模型在线增量训练方法包括:获取待预测无标签样本;通过故障检测分类模型对所述待预测无标签样本进行预测,获得预测分类结果,并确定所述预测分类结果对应的置信度,其中,所述故障检测分类模型为基于有标签样本集进行迭代训练得到的;若所述置信度满足置信度阈值条件,则将所述待预测无标签样本构建成增量训练样本;基于所述增量训练样本,对所述故障检测分类模型进行在线更新训练,获得更新后的故障检测分类模型。2.如权利要求1所述基于主动学习的模型在线增量训练方法,其特征在于,所述若所述置信度满足置信度阈值条件,则将所述待预测无标签样本构建成增量训练样本的步骤包括:若所述置信度大于所述置信度阈值,将所述待预测无标签样本设置为关键待标注样本;对所述关键待标注样本进行人工标注,获得所述增量训练样本。3.如权利要求2所述基于主动学习的模型在线增量训练方法,其特征在于,所述若所述置信度大于所述置信度阈值,将所述待预测无标签样本设置为关键待标注样本的步骤包括:获取在预设时间窗长内的各已预测样本对应的预测分类结果;分别计算各所述已预测样本分别对应的预测分类结果的均值以及标准差;基于所述均值和所述标准差,若所述置信度大于所述均值和所述标准差之间的运算结果,则将所述待预测无标签样本设置为所述关键待标注样本。4.如权利要求1所述基于主动学习的模型在线增量训练方法,其特征在于,所述基于所述增量训练样本,对所述故障检测分类模型进行在线更新训练,获得更新后的故障检测分类模型的步骤包括:基于所述增量训练样本,利用贝叶斯算法递归计算所述故障检测分类模型对应的参数后验概率分布;基于所述参数后验概率分布,对所述故障检测分类模型进行在线增量更新,获得所述更新后的故障检测分类模型。5.如权利要求1所述基于主动学习的模型在线增量训练方法,其特征在于,在所述通过故障检测分类模型对所述待预测无标签样本集进行预测,获得预测分类结果,并确定所述待预测无标签样本集中各待预测无标签样本分别对应的置信度,其中,所述故障检测分类模型为基于有标签样本集进行迭代训练得到的步骤之前,所述基于...

【专利技术属性】
技术研发人员:冯建设花霖陈军刘桂芬姚琪周雷欧馨王宗强赵一波许琦枫
申请(专利权)人:深圳市信润富联数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1