将多个预定类别的标签分配给图像的像素的装置和方法制造方法及图纸

技术编号:21300230 阅读:28 留言:0更新日期:2019-06-12 08:05
将多个预定类别的标签分配给图像的像素的装置和方法。一种用于将多个预定类别之一的标签分配给图像中的每个像素的装置,所述装置被配置成接收由摄像机拍摄的图像,所述图像包含多个像素;使用编码器卷积神经网络来生成针对每个像素的概率值,每个概率值指示所述相应像素与所述多个预定类别之一相关联的概率;根据所述概率值为每个像素生成类别预测值,所述类别预测值预测所述多个预定类别中的、与所述相应像素相关联的类别;使用边缘检测算法来预测在所述图像中示出的对象之间的边界,所述像素的所述类别预测值被用作所述边缘检测算法的输入值;以及将所述多个预定类别之一的标签分配给所述图像中的每个像素。

A device and method for assigning labels of multiple predetermined categories to pixels of an image

A device and method for assigning labels of a plurality of predetermined categories to pixels of an image. A device for assigning labels of one of a plurality of predetermined categories to each pixel in an image configured to receive an image captured by a camera containing multiple pixels; a coder convolution neural network is used to generate probability values for each pixel, each of which indicates an outline of the corresponding pixels associated with one of the plurality of predetermined categories. Rate; generate a category prediction value for each pixel based on the probability value, which predicts the category associated with the corresponding pixel in the predetermined categories; use an edge detection algorithm to predict the boundary between the objects shown in the image, and use the category prediction value of the pixel as the input value of the edge detection algorithm; and use the category prediction value of the pixel as the input value of the edge detection algorithm; and The label of one of the predefined categories is assigned to each pixel in the image.

【技术实现步骤摘要】
将多个预定类别的标签分配给图像的像素的装置和方法
本专利技术涉及用于将多个预定类别的标签分配给图像的像素的装置和方法。
技术介绍
语义(semantic)分割的目标是利用若干预定类别(例如,汽车、行人、道路、建筑物等)中的一个来标记给定输入图像中的每个像素。具有这种可靠的像素式(pixel-wise)标签将允许更有效且更准确的视觉算法。例如,知道了道路在哪里便可以更快地执行车道检测。如果仅在车辆内对头灯和尾灯进行搜索,则可以大大减少头灯和尾灯的检测误差(即,误报)。由于现代图像包含数百万个像素,所以该任务很快变得对计算要求极高,甚至对于与像素数量线性地成比例的最有效算法也是如此。在交互式运行时间中,这种算法对嵌入式系统的适用性将需要高端系统,这转而将导致明显更高的产品成本和降低的竞争力。当前现有技术的算法通常报告在诸如图形处理单元(GPU)的高电压昂贵硬件上的2-4帧每秒(FPS)的执行周期。迄今为止最准确的算法使用卷积神经网络(CNN)。CNN是一种被设计成模仿从眼睛到视觉皮层的人类视觉处理系统的人工神经网络。它们由任意数量的连续层组成,这些连续层被一起训练以完成给定的视觉任务,例本文档来自技高网...

【技术保护点】
1.一种用于将多个预定类别中的一个类别的标签分配给图像(13)的每个像素的装置(12),所述装置(12)被配置成:接收由摄像机(11)拍摄的图像(13),所述图像(13)包含多个像素;使用编码器卷积神经网络来生成针对每个像素的概率值,每个概率值指示相应像素与所述多个预定类别中的一个类别相关联的概率;根据所述概率值为每个像素生成类别预测值,所述类别预测值预测所述多个预定类别中的、与相应像素相关联的类别;使用边缘检测算法来预测所述图像(13)中示出的对象之间的边界,所述像素的所述类别预测值被用作所述边缘检测算法的输入值;以及将所述多个预定类别中的一个类别的标签分配给所述图像(13)的每个像素。

【技术特征摘要】
2017.10.18 EP 17196983.51.一种用于将多个预定类别中的一个类别的标签分配给图像(13)的每个像素的装置(12),所述装置(12)被配置成:接收由摄像机(11)拍摄的图像(13),所述图像(13)包含多个像素;使用编码器卷积神经网络来生成针对每个像素的概率值,每个概率值指示相应像素与所述多个预定类别中的一个类别相关联的概率;根据所述概率值为每个像素生成类别预测值,所述类别预测值预测所述多个预定类别中的、与相应像素相关联的类别;使用边缘检测算法来预测所述图像(13)中示出的对象之间的边界,所述像素的所述类别预测值被用作所述边缘检测算法的输入值;以及将所述多个预定类别中的一个类别的标签分配给所述图像(13)的每个像素。2.根据权利要求1所述的装置(12),其中,所述装置(12)还被配置成创建覆盖所预测的边界的像素的掩码(30),并且过滤被所述掩码(30)覆盖的所述像素。3.根据权利要求2所述的装置(12),其中,所述装置(12)还被配置成将所预测的边界的局部邻域中的像素添加至所述掩码(30)。4.根据前述权利要求中任一项所述的装置(12),其中,所述装置(12)还被配置成通过选择与具有针对每个像素的最高概率值的所述概率值相关联的所述类别,来为所述相应像素生成所述类别预测值。5.根据前述权利要求中任一项所述的装置(12),其中,所述摄像机(11)安装在车辆上。6.根据前述权利要求中任一项所述的装置(12),其中,所述边缘检测算法是Sobel边缘检测算法。7.根据前述权利要求中任一项所述的装置(12),其中,所述边缘检测算法的内核按步幅应用于所述图像(13)的所述像素。8.一种用于...

【专利技术属性】
技术研发人员:I·弗里曼J·西格蒙德
申请(专利权)人:德尔福技术有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1