一种适用于监拍装置的深度学习网络模型快速迭代训练方法及设备制造方法及图纸

技术编号：26792702 阅读：19 留言：0更新日期：2020-12-22 17:08

本申请提出一种适用于监拍装置的深度学习网络模型快速迭代训练方法及设备，方法包括：分别训练离线复杂模型和线上部署模型；基于预设时间，通过所述离线复杂模型识别来自监拍装置的并经由所述线上部署模型识别后的图像数据；确定所述多个监拍装置分别对应的线上部署模型中需要升级的线上部署模型；基于预设条件的触发，锁定需要升级的线上部署模型的网络特征提取层中预设层及预设层之前的所有层，并对所述网络特征提取层中所述预设层之后的若干层，以及所述线上部署模型的检测头网络层进行训练。本申请通过采用离线复杂多模型级联混合集成检测方式，与线上部署模型相结合进行联合训练，实现了针对不同场景的差异化定制检测和优化升级能力。

全部详细技术资料下载

【技术实现步骤摘要】
一种适用于监拍装置的深度学习网络模型快速迭代训练方法及设备
本申请涉及深度学习
，尤其涉及一种适用于监拍装置的深度学习网络模型快速迭代训练方法及设备
技术介绍
近年来，人工智能技术发展迅速，特别是以深度学习技术为核心的智能监控设备终端得到广泛应用。现有的监控设备终端产生大量图像数据回传云端服务器，网络带宽与计算吞吐量均成为云计算服务性能瓶颈。因此，将智能分析模型从服务器端移植到设备前端，基于设备前端的智能分析方式正越来越流行。然而，随着深度学习的网络结构越来越复杂，网络参数越来越多，资源需求越来越大，严重阻碍了深度学习网络模型在移动设备的可部署性。当前基于设备终端的智能分析方式，由于受到设备本身硬件资源的限制，无法有效利用服务器端的大型复杂模型。因此，当前部署在设备终端的都是轻量化网络模型，算力和识别精度都远远低于服务器端模型，对目标对象的检测效果与服务器端模型也存在较大差异。而且大规模的设备终端面临的检测场景多样，环境错综复杂，目前部署的模型大都基于大量不同场景的标注数据进行基础训练，强化其泛化能力，对于部署到实际检测一线的每一场景而言，检测效果不佳。如果针对每一个设备单独进行标注训练，人工成本高，耗时费力。随着设备终端的数量越来越多，对于场景多样化的应用场景仅靠人工二次标注训练来定制化模型的工作量也呈现指数级增长，如何快速迭代设备终端模型使其适应单一场景，是目前实现模型批量定制化服务的一大阻碍。
技术实现思路
针对上述现有技术中存在的问题，本专利技术实施例提出一种适用于监...

【技术保护点】
1.一种适用于监拍装置的深度学习网络模型快速迭代训练方法，其特征在于，所述方法包括：/n分别训练离线复杂模型和线上部署模型；其中，所述离线复杂模型是深度神经网络模型或者由多个深度神经网络模型级联后组成的神经网络模型，且其部署在服务器上，所述线上部署模型是轻量级神经网络模型且其部署在所述服务器对应的多个监拍装置上；/n基于预设时间或基于触发，通过所述离线复杂模型识别来自监拍装置的并经由所述线上部署模型识别后的图像数据；/n确定所述多个监拍装置分别对应的线上部署模型中需要升级的线上部署模型；/n基于预设条件的触发，锁定需要升级的线上部署模型的网络特征提取层中预设层及预设层之前的所有层，并对所述网络特征提取层中所述预设层之后的若干层，以及所述线上部署模型的检测头网络层进行训练。/n

【技术特征摘要】
1.一种适用于监拍装置的深度学习网络模型快速迭代训练方法，其特征在于，所述方法包括：
分别训练离线复杂模型和线上部署模型；其中，所述离线复杂模型是深度神经网络模型或者由多个深度神经网络模型级联后组成的神经网络模型，且其部署在服务器上，所述线上部署模型是轻量级神经网络模型且其部署在所述服务器对应的多个监拍装置上；
基于预设时间或基于触发，通过所述离线复杂模型识别来自监拍装置的并经由所述线上部署模型识别后的图像数据；
确定所述多个监拍装置分别对应的线上部署模型中需要升级的线上部署模型；
基于预设条件的触发，锁定需要升级的线上部署模型的网络特征提取层中预设层及预设层之前的所有层，并对所述网络特征提取层中所述预设层之后的若干层，以及所述线上部署模型的检测头网络层进行训练。

2.根据权利要求1所述的一种适用于监拍装置的深度学习网络模型快速迭代训练方法，其特征在于，对所述网络特征提取层当前所处层数之后的若干层，以及所述线上部署模型的检测头网络层进行训练之后，所述方法还包括：
将所述预设层的层数、训练后的网络特征提取层每层的网络权重以及训练后的检测头网络层每层的网络权重写入更新文件；
通知所述需要升级的线上部署模型所在的监拍装置，以使该监拍装置获取所述更新文件，以锁定所述线上部署模型网络特征提取层中预设层及预设层之前的所有层；对预设层之后的所有网络特征提取层以及检测头网络层，根据对应的网络权重进行逐层初始化，完成模型升级。

3.根据权利要求1所述的一种适用于监拍装置的深度学习网络模型快速迭代训练方法，其特征在于，所述锁定需要升级的线上部署模型的网络特征提取层中预设层及预设层之前的所有层，并对所述网络特征提取层中所述预设层之后的若干层，以及所述线上部署模型的检测头网络层进行训练，具体包括:
基于预设条件的触发，锁定所述线上部署模型的全部网络特征提取层，只训练检测头网络层；
对训练完成后的模型进行准确率检测，若所述准确率没有达到第一预设值，则逐层减小所述预设层的数值，继续训练所述预设层之后的网络特征提取层以及全部检测头网络层，直到训练完成后的模型准确率达到或超过第一预设值，则停止训练。

4.根据权利要求2所述的一种适用于监拍装置的深度学习网络模型快速迭代训练方法，其特征在于，所述方法还包括：
在初次训练线上部署模型时，将线上部署模型的网络层数据保存到网络配置文件和原始权重文件中；
所述网络配置文件中包含所述线上部署模型当前使用的深度学习算法，以及所述深度学习算法的网络配置文件；
所述原始权重文件包含所述线上部署模型初始状态下每层网络层的网络权重；
根据所述网络配置文件和所述原始权重文件对初始线上部署模型网络结构逐层进行初始化，并将所述线上部署模型安装在各监拍装置中。

5.根据权利要求1所...

【专利技术属性】
技术研发人员：刘伟，蔡富东，吕昌峰，文刚，陈雷，郭国信，
申请(专利权)人：山东信通电子股份有限公司，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人