【技术实现步骤摘要】
【国外来华专利技术】用于视觉推断的动态图像区域选择
技术介绍
本专利技术总体上涉及环境的自动语义分析,并且特别地涉及自动选择图像中的区域以用于自动语义分析。对图像中所示的环境的分析可以通过视觉推断模型来执行。视觉推断模型接收通常具有特定分辨率(例如,600×400)的图像,并且识别图像中的语义信息,例如图像中的环境的对象和其他特性。作为一个示例使用,视觉推断模型可以与车辆结合使用以识别车辆附近的对象,例如在自主或半自主控制下的车辆。视觉推断模型可以在此场景下用于识别道路上遇到的各种类型的对象,例如,汽车、人、标志、车道、车道标记等。这些视觉推断模型可以是各种类型的经训练的计算机模型,例如,神经网络,其基于大量对象图像的训练集来学习识别环境的各种对象和特征。然而,通常,成像传感器可以以比视觉推断模型直接可使用的分辨率高得多的分辨率来捕获图像。例如,成像传感器可以以1920×1280的分辨率捕获图像,而视觉推断模型可能需要具有分辨率为480×320的输入图像。在典型情况下,来自成像传感器的全尺寸图像可以被调整尺寸为视觉推断模型的分辨率。此尺寸调整会降低视觉推断模 ...
【技术保护点】
1.一种用于图像中的环境的自动视觉推断的方法,包括:/n接收环境的图像的全尺寸图像;/n识别所述图像的环境特征集,所述环境特征集描述了捕获所述全尺寸图像的环境;/n基于所述图像的所述环境特征集,在所述全尺寸图像内选择区域以用于自动视觉推断;以及/n通过将所述图像的所选择的区域应用于视觉推断模型来确定关于所述图像中的所述环境的语义信息。/n
【技术特征摘要】
【国外来华专利技术】20180402 US 62/651,6541.一种用于图像中的环境的自动视觉推断的方法,包括:
接收环境的图像的全尺寸图像;
识别所述图像的环境特征集,所述环境特征集描述了捕获所述全尺寸图像的环境;
基于所述图像的所述环境特征集,在所述全尺寸图像内选择区域以用于自动视觉推断;以及
通过将所述图像的所选择的区域应用于视觉推断模型来确定关于所述图像中的所述环境的语义信息。
2.根据权利要求1所述的方法,还包括:将所述图像的所选择的区域调整尺寸为用于所述视觉推断模型的预定尺寸。
3.根据权利要求1所述的方法,其中,所述图像的所述环境特征集包括以下中的一个或更多个:
根据所述环境的先前图像确定的语义信息;
道路结构信息,其描述了基于所述图像的所述环境中的道路的曲率;以及
从其捕获所述图像的车辆的控制信息或运动信息。
4.根据权利要求1所述的方法,其中,基于所述图像的所述环境特征集来选择所述图像的区域包括:对所述环境特征集应用规则集、对所述环境特征集应用权重集、或者对所述环境特征集应用经训练的计算机模型。
5.根据权利要求1所述的方法,其中,所确定的关于所述环境的语义信息包括在所述环境中识别的对象集以及所述图像中的针对所述对象集的边界范围。
6.根据权利要求1所述的方法,其中,所述全尺寸图像被调整尺寸为减少分辨率的图像,并且还通过将所述减少分辨率的图像应用于所述视觉推断模型来确定关于所述图像中的所述环境的语义信息。
7.根据权利要求1所述的方法,其中,所述视觉推断模型是机器学习的神经网络模型。
8.根据权利要求1所述的方法,其中,基于所述图像的所述环境特征集来选择所述图像的另一区域,并且基于所述图像的其他部分进一步确定所述语义信息。
9.一种非暂态计算机可读介质,包括可由处理器执行的指令,所述指令使所述处理器执行以下步骤:
接收环境的图像的全尺寸图像;
识别所述图像的环境特征集,所述环境特征集描述了捕获所述全尺寸图像的环境;
基于所述图像的所述环境特征集,在所述全尺寸图像内选择区域以用于自动视觉推断;以及
通过将所述图像的所选择的区域应用于视觉推理模型来确定关于所述图像中的所述环境的语义信息。
10.根据权利要求9所述的非暂态计算机可读介质,所述指令还使所述处理器执行以下步骤:将所述图像的所选择的区域调整尺寸为用于所述视觉推断模型的预定尺寸。
1...
【专利技术属性】
技术研发人员:黄明,赵亨基,戈登·黄,菲利普·齐武尔斯基,崔在亨,
申请(专利权)人:幻影人工智能公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。