一种适用于监拍装置的深度学习网络模型快速迭代训练方法及设备制造方法及图纸

技术编号:26792702 阅读:19 留言:0更新日期:2020-12-22 17:08
本申请提出一种适用于监拍装置的深度学习网络模型快速迭代训练方法及设备,方法包括:分别训练离线复杂模型和线上部署模型;基于预设时间,通过所述离线复杂模型识别来自监拍装置的并经由所述线上部署模型识别后的图像数据;确定所述多个监拍装置分别对应的线上部署模型中需要升级的线上部署模型;基于预设条件的触发,锁定需要升级的线上部署模型的网络特征提取层中预设层及预设层之前的所有层,并对所述网络特征提取层中所述预设层之后的若干层,以及所述线上部署模型的检测头网络层进行训练。本申请通过采用离线复杂多模型级联混合集成检测方式,与线上部署模型相结合进行联合训练,实现了针对不同场景的差异化定制检测和优化升级能力。

【技术实现步骤摘要】
一种适用于监拍装置的深度学习网络模型快速迭代训练方法及设备
本申请涉及深度学习
,尤其涉及一种适用于监拍装置的深度学习网络模型快速迭代训练方法及设备
技术介绍
近年来,人工智能技术发展迅速,特别是以深度学习技术为核心的智能监控设备终端得到广泛应用。现有的监控设备终端产生大量图像数据回传云端服务器,网络带宽与计算吞吐量均成为云计算服务性能瓶颈。因此,将智能分析模型从服务器端移植到设备前端,基于设备前端的智能分析方式正越来越流行。然而,随着深度学习的网络结构越来越复杂,网络参数越来越多,资源需求越来越大,严重阻碍了深度学习网络模型在移动设备的可部署性。当前基于设备终端的智能分析方式,由于受到设备本身硬件资源的限制,无法有效利用服务器端的大型复杂模型。因此,当前部署在设备终端的都是轻量化网络模型,算力和识别精度都远远低于服务器端模型,对目标对象的检测效果与服务器端模型也存在较大差异。而且大规模的设备终端面临的检测场景多样,环境错综复杂,目前部署的模型大都基于大量不同场景的标注数据进行基础训练,强化其泛化能力,对于部署到实际检测一线的每一场景而言,检测效果不佳。如果针对每一个设备单独进行标注训练,人工成本高,耗时费力。随着设备终端的数量越来越多,对于场景多样化的应用场景仅靠人工二次标注训练来定制化模型的工作量也呈现指数级增长,如何快速迭代设备终端模型使其适应单一场景,是目前实现模型批量定制化服务的一大阻碍。
技术实现思路
针对上述现有技术中存在的问题,本专利技术实施例提出一种适用于监拍装置的深度学习网络模型快速迭代训练方法及设备,解决了对线上部署模型进行单独标注训练人工成本高、模型训练周期长的问题。一方面,本专利技术实施例提供了一种适用于监拍装置的深度学习网络模型快速迭代训练方法,方法包括:分别训练离线复杂模型和线上部署模型;其中,所述离线复杂模型是深度神经网络模型或者由多个深度神经网络模型级联后组成的神经网络模型,且其部署在服务器上,所述线上部署模型是轻量级神经网络模型且其部署在所述服务器对应的多个监拍装置上;基于预设时间,通过所述离线复杂模型识别来自监拍装置的并经由所述线上部署模型识别后的图像数据;确定所述多个监拍装置分别对应的线上部署模型中需要升级的线上部署模型;基于预设条件的触发,锁定需要升级的线上部署模型的网络特征提取层中预设层及预设层之前的所有层,并对所述网络特征提取层中所述预设层之后的若干层,以及所述线上部署模型的检测头网络层进行训练。本申请实施例通过离线复杂多模型级联检测线上部署模型识别后的图像,确定需要进行升级的线上部署模型,并针对性地对需要升级的线上部署模型进行快速迭代训练,通过高精度的深度神经网络模型标注代替人工标注,使得线上部署模型的定制化升级不再需要大量的人力;另外,在线上部署模型升级时锁定指定层数的网络特征提取层,只训练未锁定的网络特征提取层和检测头网络层,也大大缩短了线上部署模型的训练周期。在一个实施方式中,对所述网络特征提取层当前所处层数之后的若干层,以及所述线上部署模型的检测头网络层进行训练之后,所述方法还包括,将锁定的网络特征提取层的层数、训练后的网络特征提取层每层的网络权重以及训练后的检测头网络层每层的网络权重写入更新文件;通知所述需要升级的线上部署模型所在的监拍装置,以使该监拍装置获取所述更新文件,以锁定所述线上部署模型网络特征提取层中预设层及预设层之前的所有层,对预设层之后的所有网络特征提取层以及检测头网络层,根据对应的网络权重进行逐层初始化,完成模型升级。本申请实施例通过将升级完成的线上部署模型的锁定的网络特征提取层数、训练后的未锁定网络特征提取层每层的网络权重以及检测头网络层每层的网络权重都写入更新文件进行保存,线上部署模型只需要读取更新文件里的数据,对原线上部署模型未锁定的网络层根据对应的网络权重进行逐层初始化,即可完成模型升级,极大地减少了数据传输量,无需传输整个模型,每次模型升级只需要传输一个更新文件即可。在一个实施方式中,所述锁定需要升级的线上部署模型的网络特征提取层中预设层及预设层之前的所有层,并对所述网络特征提取层中所述预设层之后的若干层,以及所述线上部署模型的检测头网络层进行训练,具体包括:基于预设条件的触发,锁定所述线上部署模型的全部网络特征提取层,只训练检测头网络层;对训练完成后的模型进行准确率检测,若所述准确率没有达到第一预设值,则逐层减小所述预设层的数值,继续训练所述预设层之后的的网络特征提取层以及全部检测头网络层,直到训练完成后的模型准确率达到或超过第一预设值,则停止训练。本申请实施例通过动态调整锁定的网络特征提取层的层数,在只训练检测头网络层得到的模型准确率不达标时,逐层减小锁定的网络特征提取层的层数,将剩余的网络特征提取层和检测头网络层一起训练,直到得到的线上部署模型准确率达到预设值,则停止训练,这样能够保证训练后的线上部署模型准确度接近深度神经网络的准确度,在目标检测时能够更精确地检测出目标对象,使模型更加融入所在场景。在一个实施方式中,所述方法还包括:在初次训练线上部署模型时,将线上部署模型的网络层数据保存到网络配置文件和原始权重文件中;所述网络配置文件中包含所述线上部署模型当前使用的深度学习算法,以及所述深度学习算法的网络配置文件;所述原始权重文件包含所述线上部署模型初始状态下每层网络层的网络权重;根据所述网络配置文件和所述原始权重文件对初始线上部署模型网络结构逐层进行初始化,并将所述线上部署模型安装在各监拍装置中。在一个实施方式中,所述通过所述离线复杂模型识别来自监拍装置的并经由所述线上部署模型识别后的图像数据之后,所述方法还包括:对由所述复杂离线模型识别后的图像数据进行目标对象的标注;将所述标注后的图像数据与对应的经由所述监拍装置上的线上部署模型识别后的图像数据作对比;若对于同一张图像,由所述复杂离线模型识别到的目标对象的类型和位置,与由所述线上部署模型识别出的类型和位置不同,则所述图像为误报图像;若对于同一张图像,由所述复杂离线模型识别出了目标对象,而所述线上部署模型未识别出目标对象,则所述图像为漏报图像。在一个实施方式中,所述预设条件的触发,具体为:由预设周期内各线上部署模型隐患识别的漏报率和误报率确定所述各线上部署模型隐患识别的准确率;在预设周期内,任一线上部署模型的所述准确率低于相应预设值,激活所述线上部署模型的升级任务。在一个实施方式中,所述各线上部署模型隐患识别的准确率,具体为:在所述线上部署模型升级时,在所述离线复杂模型标注后的数据中,抽取一部分作为训练样本,另一部分作为第一测试样本,在所述训练样本中再取出一部分作为第二测试样本;在对所述线上部署模型每次训练完成后,使用所述第一测试样本及第二测试样本对训练后的模型进行交叉数据验证,得到所述线上部署模型的识别准确率,以确定是否对所述线上部署模型进行更新。在一个实施方式中,所述分别训练离线复杂模型和线上部署模型,具体包括:基于相同的大规模人工标注数据集,分别训练离线复杂模型和线上部署模型;所述离本文档来自技高网...

【技术保护点】
1.一种适用于监拍装置的深度学习网络模型快速迭代训练方法,其特征在于,所述方法包括:/n分别训练离线复杂模型和线上部署模型;其中,所述离线复杂模型是深度神经网络模型或者由多个深度神经网络模型级联后组成的神经网络模型,且其部署在服务器上,所述线上部署模型是轻量级神经网络模型且其部署在所述服务器对应的多个监拍装置上;/n基于预设时间或基于触发,通过所述离线复杂模型识别来自监拍装置的并经由所述线上部署模型识别后的图像数据;/n确定所述多个监拍装置分别对应的线上部署模型中需要升级的线上部署模型;/n基于预设条件的触发,锁定需要升级的线上部署模型的网络特征提取层中预设层及预设层之前的所有层,并对所述网络特征提取层中所述预设层之后的若干层,以及所述线上部署模型的检测头网络层进行训练。/n

【技术特征摘要】
1.一种适用于监拍装置的深度学习网络模型快速迭代训练方法,其特征在于,所述方法包括:
分别训练离线复杂模型和线上部署模型;其中,所述离线复杂模型是深度神经网络模型或者由多个深度神经网络模型级联后组成的神经网络模型,且其部署在服务器上,所述线上部署模型是轻量级神经网络模型且其部署在所述服务器对应的多个监拍装置上;
基于预设时间或基于触发,通过所述离线复杂模型识别来自监拍装置的并经由所述线上部署模型识别后的图像数据;
确定所述多个监拍装置分别对应的线上部署模型中需要升级的线上部署模型;
基于预设条件的触发,锁定需要升级的线上部署模型的网络特征提取层中预设层及预设层之前的所有层,并对所述网络特征提取层中所述预设层之后的若干层,以及所述线上部署模型的检测头网络层进行训练。


2.根据权利要求1所述的一种适用于监拍装置的深度学习网络模型快速迭代训练方法,其特征在于,对所述网络特征提取层当前所处层数之后的若干层,以及所述线上部署模型的检测头网络层进行训练之后,所述方法还包括:
将所述预设层的层数、训练后的网络特征提取层每层的网络权重以及训练后的检测头网络层每层的网络权重写入更新文件;
通知所述需要升级的线上部署模型所在的监拍装置,以使该监拍装置获取所述更新文件,以锁定所述线上部署模型网络特征提取层中预设层及预设层之前的所有层;对预设层之后的所有网络特征提取层以及检测头网络层,根据对应的网络权重进行逐层初始化,完成模型升级。


3.根据权利要求1所述的一种适用于监拍装置的深度学习网络模型快速迭代训练方法,其特征在于,所述锁定需要升级的线上部署模型的网络特征提取层中预设层及预设层之前的所有层,并对所述网络特征提取层中所述预设层之后的若干层,以及所述线上部署模型的检测头网络层进行训练,具体包括:
基于预设条件的触发,锁定所述线上部署模型的全部网络特征提取层,只训练检测头网络层;
对训练完成后的模型进行准确率检测,若所述准确率没有达到第一预设值,则逐层减小所述预设层的数值,继续训练所述预设层之后的网络特征提取层以及全部检测头网络层,直到训练完成后的模型准确率达到或超过第一预设值,则停止训练。


4.根据权利要求2所述的一种适用于监拍装置的深度学习网络模型快速迭代训练方法,其特征在于,所述方法还包括:
在初次训练线上部署模型时,将线上部署模型的网络层数据保存到网络配置文件和原始权重文件中;
所述网络配置文件中包含所述线上部署模型当前使用的深度学习算法,以及所述深度学习算法的网络配置文件;
所述原始权重文件包含所述线上部署模型初始状态下每层网络层的网络权重;
根据所述网络配置文件和所述原始权重文件对初始线上部署模型网络结构逐层进行初始化,并将所述线上部署模型安装在各监拍装置中。


5.根据权利要求1所...

【专利技术属性】
技术研发人员:刘伟蔡富东吕昌峰文刚陈雷郭国信
申请(专利权)人:山东信通电子股份有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1