尺度感知单目定位和地图构建制造技术

技术编号：31011217 阅读：19 留言：0更新日期：2021-11-30 00:34

公开了一种图像处理设备，包括处理器，该处理器用于通过以下步骤估计图像特征的尺度：通过第一训练模型处理场景的多个图像，以识别图像中的特征并估计图像中这些特征的深度；通过第二训练模型处理多个图像，以估计图像的缩放比例；以及通过根据估计的缩放比例对估计的深度进行调整来估计特征的尺度。还公开了一种用于训练图像处理模型的方法。用于训练图像处理模型的方法。用于训练图像处理模型的方法。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】尺度感知单目定位和地图构建

[0001]本专利技术涉及解决在投影数码摄像机捕获的图像时尺度模糊的问题。

技术介绍

[0002]数码摄像机通过落在数字传感器上的光捕获图像，该数字传感器将收集到的光转换为数字数据，即原始数据。然后，处理原始数据以创建形成为像素场的光栅图像，其中，每个像素表示在数字传感器的一个区域接收到的亮度和颜色，该区域代表捕获的图像的一个区域。然后，像素场可以显示在屏幕上，从而可供人看到。这样，就实现了捕获的图像的投影。原始数据和处理后的数据都可以进行存储并传输到另一个设备，从而允许根据需要以及在需要时进一步再现捕获的图像。
[0003]如果该图像为场景(可以为室外场景或室内场景)，则该图像通常会包括许多对象或特征。在一些情况下，可能希望能够识别构成场景的一部分的对象。例如，如果餐馆等对象是场景的一部分，则有用的是识别餐馆，使得餐馆能够被找到，且将该餐馆的名称、位置等提供给正在所识别的餐馆所在区域中寻找餐馆使用者的设备。或者或另外，识别对象可以有利于调整和/或增强该对象在显示时的外观。在单个摄像机捕获图像的情况下，很难知道对象离该摄像机的距离。对于一个在现实生活中观看场景的人来说，这通常至少在某种程度上是显而易见的。例如，如果该对象是一辆汽车，并且它看起来大约一米高(约3英尺)，则知道一辆普通的汽车大约有1.3米(约4英尺)高的人就会推断出该汽车必定在大约10米(30英尺)远的地方。这是因为这个人会排除它是一栋房子的高度(这时会更远)的可能性，同样也会排除它是一只狗的高度(这时会更近)的可能性...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种图像处理设备(1101，1102)，其特征在于，包括处理器(1104)，用于通过以下步骤估计图像特征的尺度：通过第一训练模型处理场景的多个图像，以识别所述图像中的特征并估计所述图像中的这些特征的深度；通过第二训练模型处理所述多个图像，以估计所述图像的缩放比例；通过根据所述估计的缩放比例对所述估计的深度进行调整来估计所述特征的尺度。2.根据权利要求1所述的图像处理设备(1101，1102)，其特征在于，所述多个图像包括从不同位置捕获的所述场景的图像。3.根据权利要求2所述的图像处理设备(1101，1102)，其中，所述第一训练模型和所述第二训练模型用于独立于所述位置之间的距离进行操作。4.根据权利要求2或3所述的图像处理设备(1101，1102)，其特征在于，所述多个图像包括在不同时间捕获的所述场景的图像。5.根据上述权利要求中任一项所述的图像处理设备(1101，1102)，其特征在于，所述多个图像是公共视频流中的帧。6.根据上述权利要求中任一项所述的图像处理设备(1101，1102)，其特征在于，包括摄像机，其中，所述多个图像是由所述摄像机捕获的图像。7.根据上述权利要求中任一项所述的图像处理设备(1101，1102)，其特征在于，所述估计的深度是相对距离。8.根据上述权利要求中任一项所述的图像处理设备(1101，1102)，其特征在于，所述估计的尺度是绝对距离。9.根据上述权利要求中任一项所述的图像处理设备(1101，1102)，其特征在于，所述设备用于：对所述场景的下采样图像运行所述第一训练模型，以形成包括所述下采样图像中的所述特征深度的估计的数据集；以及处理所述数据集以放大其分辨率。10.一种用于训练图像处理模型的方法，其特征在于，包括：(a)接收(1001)多对图像，每对图像代表一个公共场景且所述每对图像中的图像从间隔一定距离的不同...

【专利技术属性】
技术研发人员：本杰明，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人