图像处理方法及装置、电子设备和存储介质制造方法及图纸

技术编号:40318701 阅读:31 留言:0更新日期:2024-02-07 21:01
本公开涉及一种图像处理方法及装置、电子设备和存储介质,所述方法应用于包括特征查询网络,以及与其连接的至少两个并行的预测端的神经网络,通过特征查询网络从待处理图像中,提取用于预测待处理图像中任意目标对象的任意感知任务的预测结果的查询向量组,通过任一预测端根据查询向量组,确定每个预测端所属感知任务的预测结果。本公开实施例可实现同时确定多个感知任务的预测结果,实现不同感知任务的兼容,提高了神经网络对各种感知任务的可扩展性,降低了维护成本。

【技术实现步骤摘要】

本公开涉及数据处理,尤其涉及一种图像处理方法及装置、电子设备和存储介质


技术介绍

1、以目标对象(例如包括人体、动物,机器人等)为中心的视觉感知任务,例如包括目标对象的位置检测任务、目标对象的姿态估计任务、目标对象的分割任务和目标对象的属性识别任务等,广泛应用于运动分析、人工智能服务、智慧城市、人群洞察、自动驾驶、虚拟现实和增强现实等领域,受到越来越广泛的关注和深入的研究,有必要提供一种维护成本低、耗时低、可扩展性好的单阶段多目标多任务感知方法。


技术实现思路

1、本公开提出了一种图像处理技术方案。

2、根据本公开的一方面,提供了一种图像处理方法,所述方法应用于神经网络,所述神经网络包括特征查询网络,以及与所述特征查询网络连接的至少两个并行的预测端,所述至少两个并行的预测端包括用于预测坐标检测类任务中任一感知任务的第一预测端,还包括除所述第一预测端以外,用于预测所述坐标检测类任务、稠密检测类任务、属性识别类任务中的至少一个预测端,所述方法包括:获取待处理图像;通过所述特征查询网络提取所述待处理图本文档来自技高网...

【技术保护点】

1.一种图像处理方法,其特征在于,所述方法应用于神经网络,所述神经网络包括特征查询网络,以及与所述特征查询网络连接的至少两个并行的预测端,所述至少两个并行的预测端包括用于预测坐标检测类任务中任一感知任务的第一预测端,还包括除所述第一预测端以外,用于预测所述坐标检测类任务、稠密检测类任务、属性识别类任务中的至少一个预测端,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述查询向量组包括至少两个具有预设维数的查询向量,所述查询向量组中查询向量的数量表征所述待处理图像中潜在目标对象的数量,每个查询向量对应一个不同的潜在目标对象,每个查询向量包括用于预测对应的潜在目标对象...

【技术特征摘要】

1.一种图像处理方法,其特征在于,所述方法应用于神经网络,所述神经网络包括特征查询网络,以及与所述特征查询网络连接的至少两个并行的预测端,所述至少两个并行的预测端包括用于预测坐标检测类任务中任一感知任务的第一预测端,还包括除所述第一预测端以外,用于预测所述坐标检测类任务、稠密检测类任务、属性识别类任务中的至少一个预测端,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述查询向量组包括至少两个具有预设维数的查询向量,所述查询向量组中查询向量的数量表征所述待处理图像中潜在目标对象的数量,每个查询向量对应一个不同的潜在目标对象,每个查询向量包括用于预测对应的潜在目标对象的任意感知任务所需的特征信息,所述预设维数的设置与所述预测端的数量无关。

3.根据权利要求1或2所述的方法,其特征在于,所述第一预测端包括用于检测目标对象对应位置的预测端。

4.根据权利要求1-3中任一项所述的方法,其特征在于,所述特征查询网络包括主干网络块、编码网络块、解码网络块,通过所述特征查询网络提取所述待处理图像中目标对象的查询向量组,包括:

5.根据权利要求4所述的方法,其特征在于,通过任一预测端根据所述查询向量组,确定所述预测端所属感知任务的预测结果,包括:

6.根据权利要求4所述的方法,其特征在于,通过任一预测端...

【专利技术属性】
技术研发人员:李树槐金晟刘文韬钱晨
申请(专利权)人:北京市商汤科技开发有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1