针对深度和视差估计的语义分割的稳健用途制造技术

技术编号：23513663 阅读：31 留言：0更新日期：2020-03-18 00:39

本公开涉及针对深度和视差估计的语义分割的稳健用途。本公开涉及用于使用语义分割来生成捕获图像的稳健深度估计的技术。语义分割可被定义为在图像上创建掩模的过程，其中像素被分割成预定义的一组语义类别。此类分割可以是二进制的(例如，“人物像素”或“非人物像素”)或多类(例如，可将像素标记为：“人物”、“狗”、“猫”等)。随着语义分割技术在准确性和采用方面的增加，开发利用此类分割和开发用于将分割信息整合到现有计算机视觉应用(诸如深度和/或视差估计)中的柔性技术的方法变得越来越重要，以在广泛的图像捕获场景中产生改善的结果。在一些实施方案中，可使用优化框架来优化相机设备的初始场景深度/视差估计，该估计采用稳健方式的语义分割和颜色正则化两者。

Robust use of semantic segmentation for depth and disparity estimation

全部详细技术资料下载

【技术实现步骤摘要】
针对深度和视差估计的语义分割的稳健用途
本公开整体涉及数字成像领域。更具体地，但并非限制性地，本公开涉及针对在数字图像中执行稳健深度和/或视差估计的技术。
技术介绍
移动的多功能设备(诸如智能电话和平板设备)的出现使得人们期望能够实时或几乎实时地生成高水平图像质量的小外形相机以集成到此类移动的多功能设备中。随着用户依赖这些多功能设备作为其日常使用的主要相机，用户越来越需要他们习惯于在专用相机设备中使用的特征。一些此类特征，例如“肖像风格”摄影模式，依赖于对所捕获图像使用估计的深度和/或视差映射，即，为了产生比通常在设备的相机系统自然捕获的图像中看到的更浅的景深的效果。(所得的具有浅景深外观的肖像风格图像在本文中也称为“SDOF”图像或“合成SDOF”图像。)例如，在此类肖像风格的合成SDOF图像中，可以将更大量的模糊应用于估计离捕获场景中的焦平面更远的对象(例如，背景对象)，而在焦平面中的对象，诸如在捕获的场景的前景中的人类主体，可以保持相对更清晰，从而愉快地强调人类主体对图像的观察者的外观。然而，某些场景捕获条件(例如，前景和背景对象可能包含相似颜色，和/或场景中单个深度平面上的对象包含多种颜色和纹理的位置)可能对用于深度和/或视差估计的典型的基于颜色图像的正则化技术提出特定挑战。语义分割在涉及图像处理和计算机视觉的产品中的使用变得越来越流行。语义分割可以被定义为创建掩模的过程，例如，图像上的逐像素掩模，其中像素被分配(或“分割”)成预定义的一组语义类别。此类分割可以是二进制的(例如，给定像素可以被...

【技术保护点】
1.一种非暂态程序存储设备，所述非暂态程序存储设备包括被存储在其上的指令，所述指令使得一个或多个处理器：/n获得场景的第一图像，所述第一图像包括多个第一像素，所述像素具有色值；/n获得包括多个第一值的第一深度或视差信息，其中每个值对应于所述场景中的位置；/n获得包括多个第一分割值的至少一个分割掩模，其中每个分割值对应于所述场景中的位置；/n针对所述至少一个分割掩模中的至少一个获得至少一个正则化项；以及/n执行优化操作以生成第一深度或视差映射，/n其中所述优化操作至少部分地基于所述多个第一像素、所述第一深度或视差信息、所述至少一个分割掩模和所述至少一个正则化项。/n

【技术特征摘要】
20180911 US 62/729,8451.一种非暂态程序存储设备，所述非暂态程序存储设备包括被存储在其上的指令，所述指令使得一个或多个处理器：
获得场景的第一图像，所述第一图像包括多个第一像素，所述像素具有色值；
获得包括多个第一值的第一深度或视差信息，其中每个值对应于所述场景中的位置；
获得包括多个第一分割值的至少一个分割掩模，其中每个分割值对应于所述场景中的位置；
针对所述至少一个分割掩模中的至少一个获得至少一个正则化项；以及
执行优化操作以生成第一深度或视差映射，
其中所述优化操作至少部分地基于所述多个第一像素、所述第一深度或视差信息、所述至少一个分割掩模和所述至少一个正则化项。

2.根据权利要求1所述的非暂态程序存储设备，其中所述指令还使得所述一个或多个处理器：至少部分地基于所述生成的第一深度或视差映射来生成所述第一图像的模糊版本。

3.根据权利要求1所述的非暂态程序存储设备，其中所述指令还使得所述一个或多个处理器：获得针对所述至少一个所获得的分割掩模中的一个的置信掩模，其中所述优化操作还至少部分地基于所述获得的置信掩模。

4.根据权利要求1所述的非暂态程序存储设备，其中所述指令还使得所述一个或多个处理器：获得针对所述至少一个分割掩模中的至少一个的最大影响值，其中所述优化操作还至少部分地基于所述获得的最大影响值。

5.根据权利要求1所述的非暂态程序存储设备，其中所述至少一个分割掩模包括至少两个分割掩模，其中所述指令还使得所述一个或多个处理器针对所述至少两个分割掩模中的每个获得至少一个正则化项，并且其中所述优化操作还至少部分地基于针对所述至少两个分割掩模中的每个的所述获得的正则化项。

6.根据权利要求1所述的非暂态程序存储设备，其中所述多个第一值中的至少一个值对应于用于捕获所述第一图像的图像捕获设备的聚焦像素的位置。

7.根据权利要求1所述的非暂态程序存储设备，其中所述至少一个正则化项中的至少一个强制执行平滑约束。

8.一种电子设备，包括：
存储器；
一个或多个图像捕获设备；
显示器；
用户界面；以及
一个或多个处理器，所述一个或多个处理器可操作地耦接到所述存储器，其中所述一个或多个处理器被配置为执行使得所述一个或多个处理器执行以下操作的指令：
从所述一个或多个图像捕获设备获得场景的第一图像，所述第一图像包括多个第一像素，所述像素具有色值；
获得包括多个第一值的第一深度或视差信息，其中每个值对应于所述场景中的位置；
获得包括多个第一分割值的至少一个分割掩模，其中每个分割值对应于所述场景中的位置；
针对所述至少一个分割掩模中的至少一个获得至少一个正则化项；以及
执行优化操作以生成第一深度或视差映射，
其中所述优化操作至少部分地基于所述多个第一像素、所述第一深度或视差信息、所述至少一个分割掩模和所...

【专利技术属性】
技术研发人员：M·N·朱皮，A·林德斯科格，M·W·陶，
申请(专利权)人：苹果公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人