【技术实现步骤摘要】
图像特征处理、深度图像生成方法及装置、介质和设备
[0001]本公开涉及图像处理
,具体而言,涉及一种图像特征处理方法、深度图像生成方法、图像特征处理装置、深度图像生成装置、计算机可读存储介质和电子设备。
技术介绍
[0002]与全卷积网络(Fully Convolution Network,FCN)相比,Transformer(变换器)能够更好地建模长距离依赖关系,这就使得Transformer在一些应用场景中更具优势。
[0003]位置编码(Positional Embedding,PE)为视觉Transformer中的可学习参数,可用作坐标索引,在空间信息建模中起着重要的作用,有助于Transformer正确地学习到要素之间的关系。
[0004]然而,目前应用Transformer的方案,仍会存在预测结果准确度不高的问题。
技术实现思路
[0005]本公开提供一种图像特征处理方法、深度图像生成方法、图像特征处理装置、深度图像生成装置、计算机可读存储介质和电子设备,进而至少在一定程度上克服模型处理结果准确度不高的问题。
[0006]根据本公开的第一方面,提供了一种图像特征处理方法,包括:获取待处理的图像特征图;从待处理的图像特征图中提取位置编码信息;利用位置编码信息对待处理的图像特征图进行特征转换,得到处理后的图像特征图。
[0007]根据本公开的第二方面,提供了一种深度图像生成方法,包括:获取彩色图以及与彩色图对应的稀疏深度图,并将彩色图与稀疏深度图进行合并 ...
【技术保护点】
【技术特征摘要】
1.一种图像特征处理方法,其特征在于,包括;获取待处理的图像特征图;从所述待处理的图像特征图中提取位置编码信息;利用所述位置编码信息对所述待处理的图像特征图进行特征转换,得到处理后的图像特征图。2.根据权利要求1所述的图像特征处理方法,其特征在于,从所述待处理的图像特征图中提取位置编码信息包括:将所述待处理的图像特征图输入位置编码提取模型,由所述位置编码提取模型对所述待处理的图像特征图进行处理,以得到所述位置编码信息。3.根据权利要求2所述的图像特征处理方法,其特征在于,所述位置编码提取模型包括1
×
1的卷积核。4.根据权利要求1所述的图像特征处理方法,其特征在于,所述位置编码信息的尺寸与所述待处理的图像特征图的尺寸一致。5.根据权利要求1至4中任一项所述的图像特征处理方法,其特征在于,利用所述位置编码信息对所述待处理的图像特征图进行特征转换,得到处理后的图像特征图,包括:利用所述位置编码信息,对所述待处理的图像特征图执行第一方向上的特征转换操作,得到中间特征图;利用所述位置编码信息,对所述中间特征图执行第二方向上的特征转换操作,得到所述处理后的图像特征图;其中,所述第一方向为特征图的宽度方向且所述第二方向为特征图的高度方向,或者所述第一方向为特征图的高度方向且所述第二方向为特征图的宽度方向。6.根据权利要求5所述的图像特征处理方法,其特征在于,利用所述位置编码信息,对所述待处理的图像特征图执行第一方向上的特征转换操作,得到中间特征图,包括:从所述待处理的图像特征图中提取键特征、值特征和查询特征;利用所述键特征、所述值特征、所述查询特征以及所述键特征的位置编码、所述值特征的位置编码、所述查询特征的位置编码,执行所述第一方向上的特征转换过程,得到所述中间特征图;其中,所述键特征的位置编码、所述值特征的位置编码、所述查询特征的位置编码包含于所述位置编码信息中。7.根据权利要求6所述的图像特征处理方法,其特征在于,从所述待处理的图像特征图中提取键特征包括:将所述待处理的图像特征图输入键特征提取模型,由所述键特征提取模型对所述待处理的图像特征图进行处理,以得到所述键特征。8.根据权利要求7所述的图像特征处理方法,其特征在于,所述键特征提取模型包括1
×
1的卷积核。9.根据权利要求6所述的图像特征处理方法,其特征在于,利用所述键特征、所述值特征、所述查询特征以及所述键特征的位置编码、所述值特征的位置编码、所述查询特征的位置编码,执行所述第一方向上的特征转换过程,得到所述中间特征图,包括:分别对所述键特征、所述值特征、所述查询特征以及所述键特征的位置编码、所述值特
征的位置编码、所述查询特征的位置编码进行与所述第一方向对应的尺寸调整;利用尺寸调整后的特征以及对应的位置编码,执行特征转换过程,得到...
【专利技术属性】
技术研发人员:宫振飞,
申请(专利权)人:OPPO广东移动通信有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。