用于多模态结构引导下的室内图像修复的系统和方法技术方案

技术编号：39125395 阅读：11 留言：0更新日期：2023-10-23 14:48

一种修复方法包括识别与从电子装置获得的图像内的移除对象相应的区域。所述方法还包括通过以下步骤来重建与所述移除对象相应的区域：(i)应用语义掩模和表面法线贴图来识别所述区域的相邻上下文并对识别的相邻上下文进行排序，并且(ii)基于排序的上下文的排序对所述排序的上下文进行采样。所述方法还包括基于采样的上下文呈现具有重建区域的所述图像。于采样的上下文呈现具有重建区域的所述图像。于采样的上下文呈现具有重建区域的所述图像。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于多模态结构引导下的室内图像修复的系统和方法

[0001]本公开总体上涉及成像系统。更具体地，本公开涉及用于基于多模态结构引导的室内图像修复以调整图像中的内容的系统和方法。

技术介绍

[0002]移动电子装置(诸如，智能电话和平板计算机)已经成为用于捕捉、上传和共享数字图像的最普遍的装置类型。在许多情况下，用户希望在上传或共享之前编辑他们的数字图像。这通常是由于难以在可控的时间成本下捕捉(根据用户判断的)“完美的”数字图像。不想要的对象移除或其他不想要的内容移除是用户通常希望在上传或共享数字图像之前执行的一种类型的编辑功能。例如，用户可能希望从数字图像中移除不想要的人或其他不想要的对象。为了执行不想要的内容移除，用户通常可识别数字图像的至少一个对象将被移除和替换的区域。然后卷积神经网络用于将替换内容填充到该区域中，其中，替换内容通常基于数字图像内剩余的其他内容。令人遗憾的是，卷积神经网络在将替换内容填充到不想要的内容被移除的区域中时通常引起不好的结果。例如，卷积神经网络通常在编辑的数字图像中生成可见的伪影。

技术实现思路

[0003]问题的技术方案
[0004]移动电子装置(诸如，智能电话和平板计算机)已经成为用于捕捉、上传和共享数字图像的最普遍的装置类型。在许多情况下，用户希望在上传或共享之前编辑他们的数字图像。这通常是由于难以在可控的时间成本下捕捉(根据用户判断的)“完美的”数字图像。不想要的对象移除或其他不想要的内容移除是用户通常希望在上传或共享数字图像之前执行的一种类型的编辑功能。例...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种修复方法，包括：识别与从电子装置获得的图像内的移除对象相应的区域；通过以下步骤重建与所述移除对象相应的所述区域：应用语义掩模和表面法线贴图来识别所述区域的相邻上下文并对识别的所述相邻上下文进行排序；并且基于排序的上下文的排序来对所述排序的上下文进行采样；并且基于采样的上下文来呈现具有重建区域的所述图像。2.根据权利要求1所述的修复方法，其中，应用所述语义掩模和所述表面法线贴图的步骤包括：应用基于多模态结构引导(MSG)的卷积来识别所述区域的所述相邻上下文并对识别的所述相邻上下文进行排序。3.根据权利要求2所述的修复方法，其中，应用所述基于MSG的卷积的步骤包括：在所述区域内设置参考像素；基于距所述参考像素的距离来识别所述相邻上下文；并且基于所述参考像素与所述相邻上下文之间的关系对所述相邻上下文中的每一个相邻上下文进行分级。4.根据权利要求3所述的修复方法，其中，对所述排序的上下文进行采样的步骤包括：从最高相关性级别到较低相关性级别和从最近距离到较远距离连续地进行采样。5.根据权利要求2所述的修复方法，其中，应用所述基于MSG的卷积的步骤包括：针对所述图像的不包括所述区域的至少一部分的每一个部分，生成针对所述图像的所述部分的语义类标签和表面矢量；针对所述图像的包括所述区域的所述至少一部分的每一个部分，(i)识别多个语义类中的与所述图像的所述部分相关联的语义类，以及(ii)基于与识别的语义类相关联的一个或更多个相邻语义代码矢量来生成针对所述图像的所述部分的表面矢量；并且基于所述语义类标签，确定所述图像的哪部分属于相同的类和相同的表面。6.根据权利要求1所述的修复方法，其中，对所述排序的上下文进行采样的步骤包括：基于所述排序的上下文的所述排序来对最相关的上下文进行采样和聚合；基于至少一个特征图估计用于应用于所述采样的上下文的注意力权重；并且将加权的上下文的部分传播到所述区域中。7.根据权利要求6所述的修复方法，其中，所述至少一个特征图包括以下特征图中的至少一个：基于语义代码矢量的第一子集的第一特征图，其中，所述语义代码矢量的第一子集包括：(i)针对所述图像的包含第一语义类的图像数据的一个或更多个部分的语义代码矢量、以及(ii)针对所述图像的包含第二语义类的图像数据的一个或更多个部分的掩模语义代码矢量；以及基于语义代码矢量的第二子集的第二特征图，其中，所述语义代码矢量的所述第二子集包括：(i)针对所述图像的包含第二语义类的所述图像数据的所述一个或更多个部分的语义代码矢量、以及(ii)针对所述图像的包含第一语义类的所述图像数据的所述一个或更多个部分的掩模语义代码矢量。
8.一种设备，包括：至少一个处理器，被配置为：识别与图像内的移除对象相应的区域；重建与所述移除对象相应的所述区域，其中，为了重建所述区域，所述至少一个处理器被配置为：应用语义掩模和表面法线贴图来识别所述区域的相邻上下文并对识别的所述相邻上下文进行排序；以及基于排序的上下文的排序来对所述排序的上下文进行采样；以...

【专利技术属性】
技术研发人员：李文博，金红霞，
申请(专利权)人：三星电子株式会社，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人