【技术实现步骤摘要】
图像处理方法及装置、电子设备和存储介质
本公开涉及计算机
,尤其涉及一种图像处理方法及装置、电子设备和存储介质。
技术介绍
随着人工智能技术的不断发展,其在计算机视觉、语音识别等方面都取得了很好的效果。在对场景中的目标(例如行人、车辆等)进行识别的任务中,可能需要预测场景中目标的数量、分布情况等。由于在该任务中,目标的尺度变化不一,目标之间可能存在不同程度的遮挡,目标的空间分布也可能不同,导致预测的精度较低。
技术实现思路
本公开提出了一种图像处理技术方案。根据本公开的一方面,提供了一种图像处理方法,包括:通过特征提取网络对待处理图像进行特征提取,得到所述待处理图像的第一特征图;通过M级编码网络对所述第一特征图进行尺度缩小及多尺度融合处理,得到编码后的多个特征图,所述多个特征图中各个特征图的尺度不同;通过N级解码网络对编码后的多个特征图进行尺度放大及多尺度融合处理,得到所述待处理图像的预测结果,M、N为大于1的整数。在一种可能的实现方式中,通过M级编码网络对所述第一特征图进行尺度缩小及多尺度融合处理,得到编码后的多个特征图,包括:通过第一级编码网络对所述第一特征 ...
【技术保护点】
1.一种图像处理方法,其特征在于,包括:通过特征提取网络对待处理图像进行特征提取,得到所述待处理图像的第一特征图;通过M级编码网络对所述第一特征图进行尺度缩小及多尺度融合处理,得到编码后的多个特征图,所述多个特征图中各个特征图的尺度不同;通过N级解码网络对编码后的多个特征图进行尺度放大及多尺度融合处理,得到所述待处理图像的预测结果,M、N为大于1的整数。
【技术特征摘要】
1.一种图像处理方法,其特征在于,包括:通过特征提取网络对待处理图像进行特征提取,得到所述待处理图像的第一特征图;通过M级编码网络对所述第一特征图进行尺度缩小及多尺度融合处理,得到编码后的多个特征图,所述多个特征图中各个特征图的尺度不同;通过N级解码网络对编码后的多个特征图进行尺度放大及多尺度融合处理,得到所述待处理图像的预测结果,M、N为大于1的整数。2.根据权利要求1所述的方法,其特征在于,通过M级编码网络对所述第一特征图进行尺度缩小及多尺度融合处理,得到编码后的多个特征图,包括:通过第一级编码网络对所述第一特征图进行尺度缩小及多尺度融合处理,得到第一级编码的第一特征图及第一级编码的第二特征图;通过第m级编码网络对第m-1级编码的m个特征图进行尺度缩小及多尺度融合处理,得到第m级编码的m+1个特征图,m为整数且1<m<M;通过第M级编码网络对第M-1级编码的M个特征图进行尺度缩小及多尺度融合处理,得到第M级编码的M+1个特征图。3.根据权利要求2所述的方法,其特征在于,通过第一级编码网络对所述第一特征图进行尺度缩小及多尺度融合处理,得到第一级编码的第一特征图及第二特征图,包括:对所述第一特征图进行尺度缩小,得到第二特征图;对所述第一特征图和所述第二特征图进行融合,得到第一级编码的第一特征图及第一级编码的第二特征图。4.根据权利要求2或3所述的方法,其特征在于,通过第m级编码网络对第m-1级编码的m个特征图进行尺度缩小及多尺度融合处理,得到第m级编码的m+1个特征图,包括:对第m-1级编码的m个特征图进行尺度缩小及融合,得到第m+1个特征图,所述第m+1个特征图的尺度小于第m-1级编码的m个特征图的尺度;对所述第m-1级编码的m个特征图以及所述第m+1个特征图进行融合,得到第m级编码的m+1个特征图。5.根据权利要求4所述的方法,其特征在于,对第m-1级编码的m个特征图进行尺度缩小及融合,得到第m+1...
【专利技术属性】
技术研发人员:杨昆霖,颜鲲,侯军,蔡晓聪,伊帅,
申请(专利权)人:北京市商汤科技开发有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。