图像处理方法、深度学习模型的训练方法、装置和设备制造方法及图纸

技术编号：33396720 阅读：15 留言：0更新日期：2022-05-11 23:16

本公开提供了一种图像处理方法，涉及人工智能领域，尤其涉及深度学习领域。具体实现方案为：根据待处理图像的第一特征图，确定移位偏移值；根据移位偏移值，对第一特征图中的数据块进行移位，得到移位后的第一特征图；以及根据移位后的第一特征图，得到待处理图像的第二特征图。本公开还提供了一种深度学习模型的训练方法、装置、电子设备和存储介质。电子设备和存储介质。电子设备和存储介质。

全部详细技术资料下载

【技术实现步骤摘要】
图像处理方法、深度学习模型的训练方法、装置和设备

[0001]本公开涉及人工智能
，尤其涉及深度学习
更具体地，本公开提供了一种图像处理方法、深度学习模型的训练方法、装置、电子设备和存储介质。

技术介绍

[0002]可以基于注意力机制对图像进行处理，得到图像的特征。例如，可以基于粗粒度的全局注意力机制或细粒度的局部注意力机制，利用Transformer模型对图像进行处理。

技术实现思路

[0003]本公开提供了一种图像处理方法、深度学习模型的训练方法、装置、设备以及存储介质。
[0004]根据本公开的一方面，提供了一种图像处理方法，该方法包括：根据待处理图像的第一特征图，确定移位偏移值；根据所述移位偏移值，对所述第一特征图中的数据块进行移位，得到移位后的第一特征图；以及根据所述移位后的第一特征图，得到所述待处理图像的第二特征图。
[0005]根据本公开的另一方面，提供了一种深度学习模型的训练方法，所述深度学习模型包括第一子网络和第二子网络，该方法包括：将样本图像输入第一子网络，得到第一特征图；所述第一特征图输入第二子网络，得到所述待处理图像的第二特征图；根据所述第二特征图，得到所述样本图像的检测值；以及根据所述样本图像的检测值与所述样本图像的标签之间的差异，调整所述第一子网络的参数和所述第二子网络的参数，得到经训练的深度学习模型；其中，所述第二特征图是通过以下操作得到的：对所述第一特征图中的数据块进行移位，得到移位后的第一特征图；以及根据所述移位后的第一特征图，得到所述待...

【技术保护点】

【技术特征摘要】
1.一种图像处理方法，包括：根据待处理图像的第一特征图，确定移位偏移值；根据所述移位偏移值，对所述第一特征图中的数据块进行移位，得到移位后的第一特征图；以及根据所述移位后的第一特征图，得到所述待处理图像的第二特征图。2.根据权利要求1所述的方法，其中，所述根据所述第一特征图，确定移位偏移值包括：确定所述第一特征图的第一特征子图和第二特征子图；分别确定所述第一特征子图的第一均值和第二特征子图的第二均值；以及根据所述第一均值和第二均值，确定所述移位偏移值。3.根据权利要求2所述的方法，其中，所述分别确定所述第一特征子图的第一均值和第二特征子图的第二均值包括：通过对所述第一特征子图和第二特征子图分别进行全局平均池化，确定所述第一均值和所述第二均值。4.根据权利要求2或3所述的方法，其中，所述根据所述第一均值和第二均值，确定所述移位偏移值包括；对所述第一均值和第二均值分别进行归一化，得到第一比例和第二比例，作为所述移位偏移值。5.根据权利要求4所述的方法，其中，所述根据所述移位偏移值，对所述第一特征图中的数据块进行移位，得到移位后的第一特征图包括：分别将所述第一比例和第二比例应用于所述第一特征图，得到第一特征图中的第一数据块和第二数据块；以及将所述第一数据块和第二数据块进行移位，得到所述移位后的第一特征图。6.根据权利要求1
‑
5之一所述的方法，其中，所述根据所述移位后的第一特征图，得到所述待处理图像的第二特征图包括：将所述移位后的第一特征图划分为多个特征图块；以及对所述多个特征图块进行处理，得到所述待处理图像的第二特征图。7.根据权利要求6所述的方法，其中，所述对所述多个特征图块进行处理，得到所述待处理图像的第二特征图包括：针对所述多个特征图块中的每个特征图块，进行多头自注意力特征检测，得到所述待处理图像的第二特征图。8.根据权利要求1所述的方法，还包括：根据所述待处理图像的第二特征图，检测所述待处理图像中的目标对象。9.一种深度学习模型的训练方法，所述深度学习模型包括第一子网络和第二子网络，所述方法包括：将样本图像输入第一子网络，得到第一特征图；将所述第一特征图输入第二子网络，得到所述待处理图像的第二特征图；根据所述第二特征图，得到所述样本图像的检测值；以及根据所述样本图像的检测值与所述样本图像的标签之间的差异，调整所述第一子网络的参数和所述第二子网络的参数，得到经训练的深度学习模型；
其中，所述第二特征图是通过以下操作得到的：对所述第一特征图中的数据块进行移位，得到移位后的第一特征图；以及根据所述移位后的第一特征图，得到所述待处理图像的第二特征图。10.根据权利要求9所述的方法，其中，所述深度学习模型包括多个特征提取级，每个特征提取级包括所述第一子网络和所述第二子网络；所述第二子网络包括多头自注意力检测分支和移位偏移值确定分支。11.根据权利要求10所述的方法，其中，所述移位偏移值确定分支包括：卷积层，用于确定所述第一特征图的第一特征子图和第二特征子图；全局平均池化层，用于分别确定所述第一特征子图的第一均值和第二特征子图的第二均值；以及映射层，用于将所述第一均值和第二均值分别映射到预定范围数值内。12.一种图像处理装置，包括：确定模块，用于根据待处理图像的第一特征图，确定移位偏移值；移位模块，用于根据所述移位偏移值，对所述第一特征图中的数据块进行移位，得到移位后的第一特征图；以及第一获得模块，用于根据所述移位后的第一特征图，得到所述待处理图像的第二特征图。13.根据权利要求12所述的装置，其中，所述确定模块包括：第一确...

【专利技术属性】
技术研发人员：武秉泓，杨叶辉，王兆玮，杨大陆，王晓荣，王磊，黄海峰，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人