【技术实现步骤摘要】
深度学习模型的训练方法、图像处理方法、装置和设备
[0001]本公开涉及人工智能
,尤其涉及深度学习、具体涉及深度学习、计算机视觉技术,可应用在智慧城市场景下。更具体地,本公开提供了一种深度学习模型的训练方法、图像处理方法、装置、电子设备和存储介质。
技术介绍
[0002]人工智能在智慧城市建设中扮演着越来越重要的角色。例如,人工智能中的计算机视觉技术用于案情识别、违规行为识别等场景,能够提高城市管理的效率、加强城市管理的安全性。
技术实现思路
[0003]本公开提供了一种深度学习模型的训练方法、图像处理方法、装置、设备以及存储介质。
[0004]根据第一方面,提供了一种深度学习模型的训练方法,该方法包括:从用于一个批次训练的多个原始图像中的每个原始图像中确定包含目标对象的至少一个图像块,得到图像块集合;针对每个原始图像,根据图像块集合生成原始图像的增强图像;针对每个原始图像,根据深度学习模型针对原始图像的输出结果,对原始图像添加干扰,得到原始图像的对抗图像;以及使用多个原始图像各自的增强图像和 ...
【技术保护点】
【技术特征摘要】
1.一种深度学习模型的训练方法,包括:从用于一个批次训练的多个原始图像中的每个原始图像中确定包含目标对象的至少一个图像块,得到图像块集合;针对每个原始图像,根据所述图像块集合生成所述原始图像的增强图像;针对每个原始图像,根据深度学习模型针对所述原始图像的输出结果,对所述原始图像添加干扰,得到所述原始图像的对抗图像;以及使用所述多个原始图像各自的增强图像和对抗图像,对所述深度学习模型进行训练,得到经训练的深度学习模型。2.根据权利要求1所述的方法,其中,所述针对每个原始图像,根据所述图像块集合生成所述原始图像的增强图像包括:针对每个原始图像,从所述图像块集合中确定预定数量的图像块,其中,所述预定数量大于等于图像块数量最小值并且小于等于图像块数量最大值,所述图像块数量包括所述多个原始图像各自的图像块数量;将所述预定数量的图像块中除来自所述原始图像的图像块以外的剩余图像块粘贴到所述原始图像中,得到融合图像;以及对所述融合图像中的图像块的边缘进行平滑处理,得到所述原始图像的增强图像。3.根据权利要求1或2所述的方法,其中,所述从多个原始图像中的每个原始图像中确定包含目标对象的至少一个图像块,得到图像块集合包括:针对每个原始图像,从所述原始图像中确定至少一个目标对象各自的边界,根据所述边界从所述原始图像中裁剪出至少一个图像块;以及根据与每个原始图像对应至少一个图像块,确定所述图像块集合。4.根据权利要求1所述的方法,其中,所述针对每个原始图像,根据深度学习模型针对所述原始图像的输出结果,对所述原始图像添加干扰,得到所述原始图像的对抗图像包括:针对每个原始图像,根据所述深度学习模型针对所述原始图像的输出结果,确定所述原始图像的损失;根据所述损失,确定与所述原始图像对应的梯度信息;以及根据所述梯度信息在所述原始图像中添加干扰,得到所述对抗图像。5.根据权利要求4所述的方法,其中,所述根据所述梯度在所述原始图像中添加干扰,得到所述对抗图像包括:根据所述梯度信息在所述原始图像中添加干扰,得到第1个干扰图像,并将所述第1个干扰图像的像素值调整到预设范围内,得到第1个调整图像;根据所述梯度信息在第n个调整图像中添加干扰,得到第n+1个干扰图像,并将第n+1个干扰图像的像素值调整到所述预设范围内,得到第n+1个调整图像,n=1,
……
,N
‑
2,N为大于2的整数;根据所述梯度信息在第N
‑
1个调整图像中添加干扰,得到第N个干扰图像,作为所述对抗图像。6.根据权利要求1所述的方法,其中,所述使用所述多个原始图像各自的增强图像和对抗图像,对所述深度学习模型进行训练,得到经训练的深度学习模型包括:将所述增强图像和所述对抗图像进行拼接,得到拼接图像;
将所述拼接图像输入所述深度学习模型,得到所述增强图像的输出结果以及所述对抗图像的输出结果;根据所述增强图像的输出结果以及所述对抗图像的输出结果,确定所述增强图像的损失和所述对抗图像的损失;以及根据所述增强图像的损失和所述对抗图像的损失,调整所述深度学习模型的参数。7.根据权利要求6所述的方法,其中,所述深度学习模型包括至少一个统计层,每个统计层包括原始统计子层和辅助统计子层;所述将所述拼接图像输入所述深度学习模型,得到所述增强图像的输出结果以及所述对抗图像的输出结果包括:针对每个统计层,响应于所述拼接图像的特征输入所述统计层,将所述拼接图像的特征拆分为增强图像的特征和对抗图像的特征;将所述增强图像的特征输入所述原始统计子层,得到所述增强图像的特征分布信息;将所述对抗图像的特征输入所述辅助统计子层,得到所述对抗图像的特征分布信息;将所述增强图像的特征分布信息和所述对抗图像的特征分布信息进行拼接,得到所述统计层的输出结果;以及根据所述统计层的输出结果,确定所述增强图像的输出结果以及所述对抗图像的输出结果。8.根据权利要求6所述的方法,其中,所述根据所述增强图像的损失和所述对抗图像的损失,调整所述深度学习模型的参数包括:对所述增强图像的损失和所述对抗图像的损失进行加权处理,得到总体损失;以及根据所述总体损失,调整所述深度学习模型的参数。9.根据权利要求6至8中任一项所述的方法,其中,所述原始图像的输出结果包括所述原始图像中的目标对象的类别,所述增强图像的输出结果包括所述增强图像中的目标对象的类别和位置信息中的至少之一,所述对抗图像的输出结果包括所述对抗图像中的目标对象的类别和位置信息中的至少之一。10.一种图像处理方法,包括:获取待处理图像;以及将所述待处理图像输入深度学习模型,得到所述待处理图像的处理结果;其中,所述深度学习模型是根据权利要求1至9中任一项所述的方法训练得到的。11.根据权利要求10所述的方法,其中,所述深度学习模型包括至少一个统计层,每个统计层包括原始统计子层和辅助统计子层;所述将所述待处理图像输入深度学习模型,得到所述待处理图像的处理结果包括:针对每个统计层,响应于所述待处理图像的特征输入所述统计层,将所述待处理图像的特征输入所述原始统计子层,得到所述待处理图像的特征分布信息,作为所述统计层的输出结果;根据所述统计层的输出结果,确定所述待处理图像的输出结果。12.根据权利要求10或11所述的方法,其中,所述待处理图像的处理结果包括所述待处理图像中目标对象的类别和位置信息中的至少之一。13.一种深度学习模型的训练装置,包括:图像块确定模块,用于从用于一个批次训练的多个原始图像中的每个原始图像中确定包含目标对象的至少一个图像块,得到图像块集合;
增强图像生成模块,用于针对每个原始图像,根据所述图像块集合生成所述原始图像的增强图像;...
【专利技术属性】
技术研发人员:沈智勇,赵一麟,陆勤,龚建,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。