用于处理图像的方法和设备技术

技术编号:46449257 阅读:11 留言:0更新日期:2025-09-19 20:52
用于场景补全的处理图像数据的方法和装置,包括:从与第一方向相对应的原始视点获得原始图像,其中,原始图像包括对象;通过基于根据从原始图像获得的二维信息生成的三维信息旋转原始图像,从与第二方向相对应的新视点获得第一图像;基于关于原始图像的对象与背景之间的深度的深度信息来确定第一图像内用于生成对象的第二表面的区域,其中,确定区域被预期包括对象区域;以及通过将第一图像和确定区域输入到AI修复模型来获得第二图像,其中,AI修复模型生成对象的第二表面,第二表面占据第二图像中的确定区域的一部分。

【技术实现步骤摘要】
【国外来华专利技术】

本公开涉及一种用于处理图像的方法及其设备,并且更具体地涉及一种用于执行掩蔽和修复以实现通用化场景补全的方法及其设备。


技术介绍

1、构建场景的三维(3d)结构对于许多应用(例如机器人导航、规划、操纵和交互)来说可能是重要的。随着智能手机和机器人搭载深度传感器的普及,3d感知能力已经提高。然而,当仅能观察到部分场景时,完整且连贯的重建仍存在挑战。

2、从单个红色、绿色、蓝色加深度(rgb-d)图像来估计包含未见对象的场景的完整3d几何图形的任务可被称为通用或可通用化的场景补全。场景补全是一项重要任务,其可优化机器人动作规划(诸如抓取规划、路径规划和长期任务规划)。场景补全也可用于诸如自主导航和用于增强现实(ar)装置和虚拟现实(vr)装置的图像生成的场景中。然而,环境的单个视图可能仅捕获场景的有限信息,这对场景补全提出了主要挑战。


技术实现思路

1、技术方案

2、示例实施例至少解决了上述问题和/或缺点以及上面未描述的其他缺点。此外,示例实施例不需要克服上述缺点,并且可不克服上述问题中的任本文档来自技高网...

【技术保护点】

1.一种用于场景补全的处理图像数据的方法,包括:

2.如权利要求1所述的方法,还包括:

3.如权利要求1至权利要求2中的任何一项所述的方法,其中,获得所述第二图像的操作包括:

4.如权利要求1至权利要求3中的任何一项所述的方法,还包括:

5.如权利要求1至权利要求4中的任何一项所述的方法,还包括:

6.如权利要求1至权利要求5中的任何一项所述的方法,其中,所述掩蔽的操作包括:

7.如权利要求1至权利要求6中的任何一项所述的方法,其中,所述掩模指示不被用于生成所述第二图像的多个像素,并且

>8.一种用于场景补...

【技术特征摘要】
【国外来华专利技术】

1.一种用于场景补全的处理图像数据的方法,包括:

2.如权利要求1所述的方法,还包括:

3.如权利要求1至权利要求2中的任何一项所述的方法,其中,获得所述第二图像的操作包括:

4.如权利要求1至权利要求3中的任何一项所述的方法,还包括:

5.如权利要求1至权利要求4中的任何一项所述的方法,还包括:

6.如权利要求1至权利要求5中的任何一项所述的方法,其中,所述掩蔽的操作包括:

7.如权利要求1至权利要求6中的任何一项所述的方法,其中,所述掩模指示不被用于生成所述第二图像的多个像素,并且

8.一种用于场景补全的处理图像数据的电子装置,所述电子装置包括:

9.如权利要求8所述的电子装置,其中,所述至少一个处理器还被配置为运行所述指令以进行以下操作:

10.如权利要求8至权利要求9中的任何一项所述的电子装置,其中...

【专利技术属性】
技术研发人员:伊萨克·久尚·笠原舒布汉·阿格拉瓦尔卡齐姆·塞利姆·恩金尼基尔·纳林什·查万·达弗勒宋舒然易卜拉欣·沃尔坎·伊斯勒
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1