图像的多任务处理方法、装置、模型的训练方法及设备制造方法及图纸

技术编号：38669605 阅读：15 留言：0更新日期：2023-09-02 22:48

本公开实施例公开了一种图像的多任务处理方法、装置、模型的训练方法及设备，其中，图像的多任务处理方法包括：确定待处理图像的目标特征图；基于目标特征图，确定各预设任务分别对应的候选掩码特征图，一个预设任务对应的候选掩码特征图包括目标特征图中属于该预设任务的像素位置掩码；基于目标特征图、各预设任务分别对应的候选掩码特征图，确定各预设任务分别对应的图像处理结果。本公开实施例基于掩码特征图可以将提取的目标特征图中不属于该任务的特征过滤掉，从而可以有效避免不同任务间特征的相互抑制，提高该任务的图像处理结果的精准度。果的精准度。果的精准度。

全部详细技术资料下载

【技术实现步骤摘要】
图像的多任务处理方法、装置、模型的训练方法及设备

[0001]本公开涉及计算机视觉技术，尤其是一种图像的多任务处理方法、装置、模型的训练方法及设备。

技术介绍

[0002]随着计算机视觉技术的飞速发展，对图像的多任务处理已应用于各种领域，比如自动驾驶领域道路环境的多目标检测或多目标语义分割，工业领域的多目标检测等。相关技术中，实现多任务处理的神经网络模型通常具有共享的骨干网络和各任务独享的预测头网络，共享的骨干网络用于提取图像特征，各任务独享的预测头网络则基于提取的图像特征预测各任务的图像处理结果，但是由于多任务具有共享的骨干网络，在训练过程中，不同任务的梯度方向不一致，使得各任务之间很难做到有效平衡，导致最终的模型对图像的多任务处理结果精准度较低。

技术实现思路

[0003]为了解决上述多任务处理结果精准度较低等技术问题，本公开的实施例提供了一种图像的多任务处理方法、装置、模型的训练方法及设备，有效提高多任务处理结果的精准度。
[0004]本公开的第一个方面，提供了一种图像的多任务处理方法，包括：确定待处理图像的目标特征图；基于所述目标特征图，确定各预设任务分别对应的候选掩码特征图，一个预设任务对应的所述候选掩码特征图包括所述目标特征图中属于该预设任务的像素位置掩码；基于所述目标特征图、各所述预设任务分别对应的所述候选掩码特征图，确定各所述预设任务分别对应的图像处理结果。
[0005]本公开的第二个方面，提供了一种图像的多任务处理模型的训练方法，包括：获取训练数据，所述训练数据包括多...

【技术保护点】

【技术特征摘要】
1.一种图像的多任务处理方法，包括：确定待处理图像的目标特征图；基于所述目标特征图，确定各预设任务分别对应的候选掩码特征图，一个预设任务对应的所述候选掩码特征图包括所述目标特征图中属于该预设任务的像素位置掩码；基于所述目标特征图、各所述预设任务分别对应的所述候选掩码特征图，确定各所述预设任务分别对应的图像处理结果。2.根据权利要求1所述的方法，其中，所述基于所述目标特征图，确定各预设任务分别对应的候选掩码特征图，包括：对于任一所述预设任务，基于预先训练获得的该预设任务对应的掩码提取网络，对所述目标特征图进行处理，获得该预设任务对应的所述候选掩码特征图。3.根据权利要求1所述的方法，其中，所述确定待处理图像的目标特征图，包括：对所述待处理图像进行多尺度特征提取，获得各尺度分别对应的第一特征图；对各尺度分别对应的所述第一特征图进行融合，获得所述待处理图像对应的所述目标特征图。4.根据权利要求1所述的方法，其中，所述基于所述目标特征图、各所述预设任务分别对应的所述候选掩码特征图，确定各所述预设任务分别对应的图像处理结果，包括：对于任一所述预设任务，基于所述目标特征图、该预设任务对应的所述候选掩码特征图、及预先训练获得的该预设任务对应的预测头网络，确定该预设任务对应的所述图像处理结果。5.一种图像的多任务处理模型的训练方法，包括：获取训练数据，所述训练数据包括多个训练图像及各训练图像分别对应的标签数据，每个训练图像对应的所述标签数据包括至少一个预设任务分别对应的结果标签；基于各所述训练图像及预先建立的多任务处理网络，确定各所述训练图像在各所述预设任务分别对应的训练图像处理结果，所述多任务处理网络包括多尺度特征提取网络、特征融合网络、各所述预设任务分别对应的掩码提取网络和预测头网络；基于各所述训练图像在各所述预设任务分别对应的训练图像处理结果、以及各所述训练图像分别对应的所述标签数据，确定网络损失；基于所述网络损失调整网络参数，获得更新后的多任务处理网络；响应于更新后的多任务处理网络的网络损失满足预设条件，获得图像的多任务处理模型。6.根据权利要求5所述的方法，其中，每个训练图像对应的所述标签数据还包括各预设任务分别对应的掩码标签；所述基于各所述训练图像及预先建立的多任务处理网络，确定各所述训练图像在各所述预设任务分别对应的训练图像处...

【专利技术属性】
技术研发人员：李婧，
申请(专利权)人：北京地平线信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人