图像处理方法和装置、电子设备、计算机可读存储介质制造方法及图纸

技术编号:34638526 阅读:11 留言:0更新日期:2022-08-24 15:13
本公开关于一种图像处理方法和装置、电子设备、计算机可读存储介质,图像处理方法包括:对目标图像进行深度估计处理,得到目标图像的每个像素点的预估深度值和预估偏移量;根据目标图像的每个像素点的预估偏移量,确定相应像素点的偏移像素点;将目标图像中每个像素点的偏移像素点对应的预估深度值,作为相应像素点的修正深度值;基于目标图像的每个像素点的修正深度值,得到目标图像的深度图。本公开可同时预估深度图和深度图的偏移量,并通过预估的偏移量来修正预估深度图上深度值的分布,从而在耗费很小计算量的情况下消除过渡带,提升深度图清晰度。度图清晰度。度图清晰度。

【技术实现步骤摘要】
图像处理方法和装置、电子设备、计算机可读存储介质


[0001]本公开涉及深度学习
,尤其涉及一种图像处理方法和装置、电子设备、计算机可读存储介质。

技术介绍

[0002]单目深度估计是指基于深度学习预测RGB(Red Green Blue,红绿蓝颜色系统,通过对红、绿、蓝三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色)图像上每个点距离相机平面的距离,即每个点的深度,从而得到RGB图像的深度图。但基于深度学习的深度估计方法得到的深度图,往往存在边界有过渡带、清晰度不足的问题。
[0003]相关技术为解决该问题,存在两类方案。一类是采用二维的导向滤波处理来提升深度细节,但深度图是一种三维信息,该方案会破坏三维几何结构,例如对于一个倾斜的墙面,深度是从近到远分布的,该方案会使得墙面的倾斜角度发生变化,并且会将二维的图像边界处理为深度图上的边界,带来虚假边沿的问题。另一类是加大深度估计模型的输入尺寸来提升深度细节,但无疑会大幅增加计算量,不便于在移动端应用。

技术实现思路

[0004]本公开提供一种图像处理方法和装置、电子设备、计算机可读存储介质,以至少解决相关技术中的如何在不大幅增加计算量的情况下提升深度图的清晰度的问题,也可不解决任何上述问题。
[0005]根据本公开的第一方面,提供了一种图像处理方法,所述图像处理方法包括:对目标图像进行深度估计处理,得到所述目标图像的每个像素点的预估深度值和预估偏移量;根据所述目标图像的每个像素点的所述预估偏移量,确定相应像素点的偏移像素点;将所述目标图像中每个像素点的所述偏移像素点对应的所述预估深度值,作为相应像素点的修正深度值;基于所述目标图像的每个像素点的所述修正深度值,得到所述目标图像的深度图。
[0006]可选地,所述根据所述目标图像的每个像素点的所述预估偏移量,确定相应像素点的偏移像素点,包括:针对所述目标图像的每个像素点,通过将相应像素点的坐标值与相应像素点的预估偏移量相加,得到相应像素点的偏移像素点的坐标值。
[0007]可选地,每个像素点均具有第一方向坐标值和第二方向坐标值,每个像素点的预估偏移量包括第一方向预估偏移量和第二方向预估偏移量,其中,所述针对所述目标图像的每个像素点,通过将相应像素点的坐标值与相应像素点的预估偏移量相加,得到相应像素点的偏移像素点的坐标值,包括:针对所述目标图像的每个像素点,通过将相应像素点的第一方向坐标值和相应像素点的第一方向预估偏移量相加,得到相应像素点的偏移像素点的第一方向坐标值,通过将相应像素点的第二方向坐标值和相应像素点的第二方向预估偏移量相加,得到相应像素点的偏移像素点的第二方向坐标值。
[0008]可选地,在所述目标图像处于直角坐标系的情况下,所述第一方向为直角坐标系
的x方向,所述第二方向为直角坐标系的y方向;或在所述目标图像处于极坐标系的情况下,所述第一方向为极坐标系的极径方向,所述第二方向为极坐标系的极角方向。
[0009]可选地,所述对目标图像进行深度估计处理,得到所述目标图像的每个像素点的预估深度值和预估偏移量,包括:将所述目标图像输入深度估计模型,得到所述深度估计模型的输出结果;其中,所述输出结果包括所述目标图像的每个像素点的所述预估深度值和所述预估偏移量。
[0010]可选地,所述深度估计模型通过如下步骤训练得到:获取样本图像和所述样本图像的每个像素点的参考深度值;将所述样本图像输入所述深度估计模型,得到所述样本图像的每个像素点的样本预估深度值和样本预估偏移量;根据所述样本图像的每个像素点的所述参考深度值和所述样本预估深度值,确定所述样本图像的每个像素点的参考偏移量;基于所述样本图像的每个像素点的所述参考深度值、所述样本预估深度值、所述参考偏移量和所述样本预估偏移量,确定损失值;基于所述损失值调整所述深度估计模型的参数,以对所述深度估计模型进行训练。
[0011]可选地,所述根据所述样本图像的每个像素点的所述参考深度值和所述样本预估深度值,确定所述样本图像的每个像素点的参考偏移量,包括:遍历所述样本图像的所有像素点,确定当前像素点周围的若干个参考点;根据所述当前像素点的所述参考深度值和所述当前像素点的每个参考点的所述样本估计深度值,确定所述当前像素点的相应参考点的权重;确定所述当前像素点的每个参考点相对于所述当前像素点的偏移量;根据所述当前像素点的每个参考点的权重,对所述当前像素点的所有参考点的偏移量求取加权平均值,作为所述当前像素点的所述参考偏移量。
[0012]可选地,所述根据所述当前像素点的所述参考深度值和所述当前像素点的每个参考点的所述样本估计深度值,确定所述当前像素点的相应参考点的权重,包括:确定所述当前像素点的每个参考点的所述样本估计深度值与所述当前像素点的所述参考深度值之间的误差的绝对值,作为相应参考点的误差;根据所述当前像素点的每个参考点的误差,确定所述当前像素点的每个参考点的权重,每个参考点的权重与相应参考点的误差负相关。
[0013]可选地,所述根据所述当前像素点的每个参考点的误差,确定所述当前像素点的每个参考点的权重,包括:确定所述当前像素点的每个参考点的误差与设定值的和值,并确定所述设定值与所述和值的比值,作为相应参考点的权重;其中,所述设定值为正数。
[0014]可选地,所述确定当前像素点周围的若干个参考点,包括:在所述样本图像的所有像素点中,确定与所述当前像素点在第一方向和第二方向上的间距均小于相应参考值的像素点,作为所述当前像素点的参考点;或在所述样本图像的所有像素点中,确定与所述当前像素点的直线距离小于参考值的像素点。
[0015]可选地,所述基于所述样本图像的每个像素点的所述参考深度值、所述样本预估深度值、所述参考偏移量和所述样本预估偏移量,确定损失值,包括:基于所述样本图像的每个像素点的所述参考深度值和所述样本预估深度值,计算第一损失值;基于所述样本图像的每个像素点的所述参考偏移量和所述样本预估偏移量,计算第二损失值;基于所述第一损失值和所述第二损失值,确定所述损失值。
[0016]根据本公开的第二方面,提供了一种图像处理装置,所述图像处理装置包括:预估单元,被配置为:对目标图像进行深度估计处理,得到所述目标图像的每个像素点的预估深
度值和预估偏移量;偏移单元,被配置为:根据所述目标图像的每个像素点的所述预估偏移量,确定相应像素点的偏移像素点;修正单元,被配置为:将所述目标图像中每个像素点的所述偏移像素点对应的所述预估深度值,作为相应像素点的修正深度值;汇总单元,被配置为:基于所述目标图像的每个像素点的所述修正深度值,得到所述目标图像的深度图。
[0017]可选地,所述偏移单元还被配置为:针对所述目标图像的每个像素点,通过将相应像素点的坐标值与相应像素点的预估偏移量相加,得到相应像素点的偏移像素点的坐标值。
[0018]可选地,每个像素点均具有第一方向坐标值和第二方向坐标值,每个像素点的预估偏移量包括第一方向预估偏移量和第二方向预估偏移量,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像处理方法,其特征在于,所述图像处理方法包括:对目标图像进行深度估计处理,得到所述目标图像的每个像素点的预估深度值和预估偏移量;根据所述目标图像的每个像素点的所述预估偏移量,确定相应像素点的偏移像素点;将所述目标图像中每个像素点的所述偏移像素点对应的所述预估深度值,作为相应像素点的修正深度值;基于所述目标图像的每个像素点的所述修正深度值,得到所述目标图像的深度图。2.如权利要求1所述的图像处理方法,其特征在于,所述根据所述目标图像的每个像素点的所述预估偏移量,确定相应像素点的偏移像素点,包括:针对所述目标图像的每个像素点,通过将相应像素点的坐标值与相应像素点的预估偏移量相加,得到相应像素点的偏移像素点的坐标值。3.如权利要求2所述的图像处理方法,其特征在于,每个像素点均具有第一方向坐标值和第二方向坐标值,每个像素点的预估偏移量包括第一方向预估偏移量和第二方向预估偏移量,其中,所述针对所述目标图像的每个像素点,通过将相应像素点的坐标值与相应像素点的预估偏移量相加,得到相应像素点的偏移像素点的坐标值,包括:针对所述目标图像的每个像素点,通过将相应像素点的第一方向坐标值和相应像素点的第一方向预估偏移量相加,得到相应像素点的偏移像素点的第一方向坐标值,通过将相应像素点的第二方向坐标值和相应像素点的第二方向预估偏移量相加,得到相应像素点的偏移像素点的第二方向坐标值。4.如权利要求3所述的图像处理方法,其特征在于,在所述目标图像处于直角坐标系的情况下,所述第一方向为直角坐标系的x方向,所述第二方向为直角坐标系的y方向;或在所述目标图像处于极坐标系的情况下,所述第一方向为极坐标系的极径方向,所述第二方向为极坐标系的极角方向。5.如权利要求1到4中的任一权利要求所述的图像处理方法,其特征在于,所述对目标图像进行深度估计处理,得到所述目标图像的每个像素点的预估深度值和预估偏移量,包括:将所述目标图像输入深度估计模型,得到所述深度估计...

【专利技术属性】
技术研发人员:刘继文
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1