基于深度学习的检测模型生成方法及装置制造方法及图纸

技术编号:33885056 阅读:15 留言:0更新日期:2022-06-22 17:17
本发明专利技术公开了一种基于深度学习的检测模型生成方法及装置,该方法包括构建包括第一卷积模块的深度学习模型;获取训练集,并利用训练集对深度学习模型进行训练,获得目标检测模型;对目标检测模型进行重参数化,以使目标检测模型中的第一卷积模块替换为第二卷积模块;将替换后的目标检测模型发送至终端设备,终端设备在接收到待检测数据时,执行检测任务。本发明专利技术通过在训练时采用第一卷积模块执行训练任务,并在将训练完成的目标检测模型部署至终端设备时,将目标检测模型的第一卷机模块替换为第二卷积模块,使得在训练的时候有比较高的计算量与参数量,但是部署的时候和正常的网络计算量接近一致,显著提升了目标检测模型的性能。能。能。

【技术实现步骤摘要】
基于深度学习的检测模型生成方法及装置


[0001]本专利技术涉及图像识别
,尤其涉及到一种基于深度学习的检测模型生成方法及装置。

技术介绍

[0002]深度学习技术是人工智能的一个重要领域。它是指通过深度学习算法对图像进行对象识别。深度学习技术的应用非常广泛,比较典型的应用例如是人脸识别和车牌识别。
[0003]深度学习的效果一般受限于网络参数量和网络计算量。网络计算量越大或者网络参数量越大,相应的拟合效果越好。但是为了保证一些视频处理的实时性,网络计算量越大带来的问题就是部署的时候对于显卡或者计算设备的要求过高,网络参数量过大引起的是占用硬盘空间越大。为了维持部署的实时性,通常会设定一定的网络计算量,但是同比就损失了一定的模型性能。因此,如何提高基于深度学习的检测模型的检测性能,是一个亟需解决的技术问题。
[0004]上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。

技术实现思路

[0005]本专利技术的主要目的在于提供一种基于深度学习的检测模型生成方法、装置、设备及存储介质,旨在解决目前基于深度学习的检测模型的检测性能不高的技术问题。
[0006]为实现上述目的,本专利技术提供一种基于深度学习的检测模型生成方法,所述方法包括以下步骤:
[0007]构建深度学习模型;其中,所述深度学习模型包括第一卷积模块;
[0008]获取训练集,并利用所述训练集对所述深度学习模型进行训练,获得目标检测模型;
[0009]对所述目标检测模型进行重参数化,以使所述目标检测模型中的第一卷积模块替换为第二卷积模块;
[0010]将替换后的所述目标检测模型发送至终端设备,以使所述终端设备在接收到待检测数据时,执行检测任务。
[0011]可选的,所述第一卷积模块包括至少一个第一conv+bn模块,所述第一conv+bn模块的输入端为N通道输入端,所述第一conv+bn模块的输出端为N通道输出端。
[0012]可选的,所述第二卷积模块包括至少一个第二conv+bn模块和至少一个第三conv+bn模块,所述第二conv+bn模块的输入端为N通道输入端,所述第二conv+bn模块的输出端连接第三conv+bn模块的输入端,所述第三conv+bn模块的输出端为N通道输出端。
[0013]可选的,所述第一conv+bn模块和第二conv+bn模块的尺寸为3
×
3,所述第三conv+bn模块的尺寸为1
×
1。
[0014]可选的,所述第二conv+bn模块的输出端和第三conv+bn模块的输入端为N
×
4传输
通道。
[0015]可选的,所述深度学习模型采用resnet结构或vgg结构。
[0016]可选的,所述训练集为训练图像集,所述待检测数据为待检测图像。
[0017]此外,为了实现上述目的,本专利技术还提供了一种基于深度学习的检测模型生成装置,所述基于深度学习的检测模型生成装置包括:
[0018]构建模块,用于构建深度学习模型;其中,所述深度学习模型包括第一卷积模块;
[0019]获取模块,用于获取训练集,并利用所述训练集对所述深度学习模型进行训练,获得目标检测模型;
[0020]替换模块,用于对所述目标检测模型进行重参数化,以使所述目标检测模型中的第一卷积模块替换为第二卷积模块;
[0021]发送模块,用于将替换后的所述目标检测模型发送至终端设备,以使所述终端设备在接收到待检测数据时,执行检测任务。
[0022]此外,为了实现上述目的,本专利技术还提供了一种基于深度学习的检测模型生成设备,所述基于深度学习的检测模型生成设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于深度学习的检测模型生成程序,所述基于深度学习的检测模型生成程序被所述处理器执行时实现如上所述的基于深度学习的检测模型生成方法的步骤。
[0023]此外,为了实现上述目的,本专利技术还提供了一种存储介质,所述存储介质上存储有基于深度学习的检测模型生成程序,所述基于深度学习的检测模型生成程序被处理器执行时实现如上所述的基于深度学习的检测模型生成方法的步骤。
[0024]本专利技术实施例提出的一种基于深度学习的检测模型生成方法、装置、设备及存储介质,该方法包括构建深度学习模型;其中,所述深度学习模型包括第一卷积模块;获取训练集,并利用所述训练集对所述深度学习模型进行训练,获得目标检测模型;对所述目标检测模型进行重参数化,以使所述目标检测模型中的第一卷积模块替换为第二卷积模块;将替换后的所述目标检测模型发送至终端设备,以使所述终端设备在接收到待检测数据时,执行检测任务。本专利技术通过在训练时采用第一卷积模块执行训练任务,并在将训练完成的目标检测模型部署至终端设备时,将目标检测模型的第一卷机模块替换为第二卷积模块,使得在训练的时候有比较高的计算量与参数量,但是部署的时候和正常的网络计算量接近一致,显著提升了目标检测模型的性能。
附图说明
[0025]图1为本专利技术实施例中基于深度学习的检测模型生成设备的结构示意图;
[0026]图2为本专利技术基于深度学习的检测模型生成方法的实施例的流程示意图;
[0027]图3为本专利技术实施例中基于深度学习的检测模型生成装置的结构框图。
[0028]本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0029]应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0030]深度学习技术是人工智能的一个重要领域。它是指通过深度学习算法对图像进行
对象识别。深度学习技术的应用非常广泛,比较典型的应用例如是人脸识别和车牌识别。
[0031]深度学习的效果一般受限于网络参数量和网络计算量。网络计算量越大或者网络参数量越大,相应的拟合效果越好。但是为了保证一些视频处理的实时性,网络计算量越大带来的问题就是部署的时候对于显卡或者计算设备的要求过高,网络参数量过大引起的是占用硬盘空间越大。为了维持部署的实时性,通常会设定一定的网络计算量,但是同比就损失了一定的模型性能。因此,如何提高基于深度学习的检测模型的检测性能,是一个亟需解决的技术问题。
[0032]为了解决这一问题,提出本专利技术的基于深度学习的检测模型生成方法的各个实施例。本专利技术提供的一种基于深度学习的检测模型生成方法、装置、设备及存储介质,该方法包括构建深度学习模型;其中,所述深度学习模型包括第一卷积模块;获取训练集,并利用所述训练集对所述深度学习模型进行训练,获得目标检测模型;对所述目标检测模型进行重参数化,以使所述目标检测模型中的第一卷积模块替换为第二卷积模块;将替换后的所述目标检测模型发送至终端设备,以使所述终端设备在接收到待检测数据时,执行检测任务。本专利技术通过在训练时采用第一卷积模块执行训练任务,并在将训练完成的目标检测模型部署至终端设备时,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的检测模型生成方法,其特征在于,所述方法包括以下步骤:构建深度学习模型;其中,所述深度学习模型包括第一卷积模块;获取训练集,并利用所述训练集对所述深度学习模型进行训练,获得目标检测模型;对所述目标检测模型进行重参数化,以使所述目标检测模型中的第一卷积模块替换为第二卷积模块;将替换后的所述目标检测模型发送至终端设备,以使所述终端设备在接收到待检测数据时,执行检测任务。2.如权利要求1所述的基于深度学习的检测模型生成方法,其特征在于,所述第一卷积模块包括至少一个第一conv+bn模块,所述第一conv+bn模块的输入端为N通道输入端,所述第一conv+bn模块的输出端为N通道输出端。3.如权利要求2所述的基于深度学习的检测模型生成方法,其特征在于,所述第二卷积模块包括至少一个第二conv+bn模块和至少一个第三conv+bn模块,所述第二conv+bn模块的输入端为N通道输入端,所述第二conv+bn模块的输出端连接第三conv+bn模块的输入端,所述第三conv+bn模块的输出端为N通道输出端。4.如权利要求3所述的基于深度学习的检测模型生成方法,其特征在于,所述第一conv+bn模块和第二conv+bn模块的尺寸为3
×
3,所述第三conv+bn模块的尺寸为1
×
1。5.如权利要求3所述的基于深度学习的检测模型生成方法,其特征在于,所述第二conv+bn模块的输出端和第三conv+bn...

【专利技术属性】
技术研发人员:周卓立任鹏
申请(专利权)人:成都臻识科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1