图像识别方法、装置、设备和存储介质制造方法及图纸

技术编号:28130950 阅读:16 留言:0更新日期:2021-04-19 11:52
本申请提供一种图像识别方法、装置、设备和存储介质,该方法包括:在原始图像中,定位目标对象的至少一个定位点;获取所述目标对象的每个像素点与所述定位点之间的偏移量;根据所述偏移量从所述原始图像中的各个像素点中获得对应于所述定位点的目标像素点集合;根据所述目标像素点集合识别所述原始图像中的所述目标对象。本申请实现了在很小的计算量下可以获得更加准确的识别结果。获得更加准确的识别结果。获得更加准确的识别结果。

【技术实现步骤摘要】
图像识别方法、装置、设备和存储介质


[0001]本申请涉及图像处理
,具体而言,涉及一种图像识别方法、装置、设备和存储介质。

技术介绍

[0002]图像实例分割(image instance segmentation)是计算机视觉(computer vision)的一项核心技术。随着深度学习的普及,实例分割在无人驾驶,机器人导航,手机图像编辑中都有着重要的作用。
[0003]实例分割指从图像中将每一个物体的像素点单独分割出来。不同于语义分割(Semantic Segmentation),实例分割的难点在于要将同一类别的物体要和其他物体一一区分出来。依赖于深度学习,目前图像识别的主要做法是结合图像检测与物体分割。深度学习可以获得每个物体的候选框,候选框通常用一个矩形框的四个顶点表示。当把候选框特征扩展为一个特征图时,既可以表示为框内物体的分割结果。这类方法有两类明显的缺点。一方面需要非常复杂的网络。由于需要回归出所有候选框的分割结果,模型的计算量非常大。另一方面,分割的精度受到限制。同样受限于模型计算能力,回归的分割特征图分辨率不能太高,这使得实例分割的精度很差。
[0004]人像实例分割是图像实例分割的一个特例。在大部分的图像中,人像都是其中最重要的元素。尽管类别数有了减少,人像实例分割的精度并没有得到明显的提升。

技术实现思路

[0005]本申请实施例的目的在于提供一种图像识别方法、装置、设备和存储介质,实现了在识别结果的像素点与原始图像一样大的基础上,降低图像识别计算量,提高了图像识别的边缘精度。
[0006]本申请实施例第一方面提供了一种图像识别方法,包括:在原始图像中,定位目标对象的至少一个定位点;获取所述目标对象的每个像素点与所述定位点之间的偏移量;根据所述偏移量从所述原始图像中的各个像素点中获得对应于所述定位点的目标像素点集合;根据所述目标像素点集合识别所述原始图像中的所述目标对象。
[0007]于一实施例中,所述在原始图像中,定位目标对象的至少一个定位点,包括:通过定位分支模型获得所述原始图像的定位特征图;对所述定位特征图进行二值化处理,并对二值化处理后的所述定位特征图进行聚类处理,得到每个所述定位点在所述原始图像中的位置信息。
[0008]于一实施例中,所述定位特征图中对应于所述目标对象的指定部位的特征值为1

0,其中,远离所述定位点的位置的特征值趋近于0,靠近所述定位点的位置的特征值趋近于1。
[0009]于一实施例中,所述获取所述目标对象的每个像素点与所述定位点之间的偏移量,包括:基于偏移量分支模型,计算得到所述原始图像的偏移量特征图,所述偏移量特征
图中包括:所述目标对象的每个像素点与所述定位点之间的相对位置偏移量。
[0010]于一实施例中,所述根据所述目标像素点集合识别所述原始图像中的所述目标对象,包括:从所述原始图像中分割出所述目标对象所在的前景图像;将所述前景图像中对应于所述定位点的所述目标像素点集合归为所述目标对象。
[0011]于一实施例中,所述从所述原始图像中分割出所述目标对象所在的前景图像,包括:采用语义和边缘分割网络从所述原始图像中分割出每个所述目标对象所在的前景图像。
[0012]于一实施例中,所述语义和边缘分割网络包括:主干网络,包括多个卷积层,用于对所述原始图像进行上采样、下采样、特征叠加中的一种或多种处理;分支网络,包括多个卷积层,用于对所述主干网络处理后的图像进行上采样、下采样、特征叠加中的一种或多种处理。
[0013]本申请实施例第二方面提供了一种图像识别装置,包括:定位模块,用于在原始图像中,定位目标对象的至少一个定位点;获取模块,用于获取所述目标对象的每个像素点与所述定位点之间的偏移量;获得模块,用于根据所述偏移量从所述原始图像中的各个像素点中获得对应于所述定位点的目标像素点集合;识别模块,用于根据所述目标像素点集合识别所述原始图像中的所述目标对象。
[0014]于一实施例中,所述定位模块用于:通过定位分支模型获得所述原始图像的定位特征图;对所述定位特征图进行二值化处理,并对二值化处理后的所述定位特征图进行聚类处理,得到每个所述定位点在所述原始图像中的位置信息。
[0015]于一实施例中,所述定位特征图中对应于所述目标对象的指定部位的特征值为1

0,其中,远离所述定位点的位置的特征值趋近于0,靠近所述定位点的位置的特征值趋近于1。
[0016]于一实施例中,所述获取模块用于:基于偏移量分支模型,计算得到所述原始图像的偏移量特征图,所述偏移量特征图中包括:所述目标对象的每个像素点与所述定位点之间的相对位置偏移量。
[0017]于一实施例中,所述识别模块用于:从所述原始图像中分割出所述目标对象所在的前景图像;将所述前景图像中对应于所述定位点的所述目标像素点集合归为所述目标对象。
[0018]于一实施例中,所述从所述原始图像中分割出所述目标对象所在的前景图像,包括:采用语义和边缘分割网络从所述原始图像中分割出每个所述目标对象所在的前景图像。
[0019]于一实施例中,所述语义和边缘分割网络包括:主干网络,包括多个卷积层,用于对所述原始图像进行上采样、下采样、特征叠加中的一种或多种处理;分支网络,包括多个卷积层,用于对所述主干网络处理后的图像进行上采样、下采样、特征叠加中的一种或多种处理。
[0020]本申请实施例第三方面提供了一种电子设备,包括:存储器,用以存储计算机程序;处理器,用以执行本申请实施例第一方面及其任一实施例的方法,以识别出原始图像中的目标对象。
[0021]本申请实施例第四方面提供了一种非暂态电子设备可读存储介质,包括:程序,当
其藉由电子设备运行时,使得所述电子设备执行本申请实施例第一方面及其任一实施例的方法。
[0022]本申请提供的图像识别方法、装置、设备和存储介质,通过对原始图像中的目标对象进行定位点定位,并计算目标对象的每个像素点与其对应的定位点之间的偏移量,然后基于该偏移量可以确定定位点在原始图像中属于哪一个定位点,进而得到原始图像中的对应于所述定位点的目标像素点集合,最后根据每个定位点的目标像素集合识别出原始图像中的所有目标对象。如此,相比于现有技术中分割技术,降低了计算量,在识别结果的像素点与原始图像一样大的基础上,提高了图像识别的边缘精度。
附图说明
[0023]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0024]图1为本申请一实施例的电子设备的结构示意图;
[0025]图2为本申请一实施例的神经网络的示意图;
[0026]图3为本申请一实施例的图像识别方法的流程示意图;
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别方法,其特征在于,包括:在原始图像中,定位目标对象的至少一个定位点;获取所述目标对象的每个像素点与所述定位点之间的偏移量;根据所述偏移量从所述原始图像中的各个像素点中获得对应于所述定位点的目标像素点集合;根据所述目标像素点集合识别所述原始图像中的所述目标对象。2.根据权利要求1所述的方法,其特征在于,所述在原始图像中,定位目标对象的至少一个定位点,包括:通过定位分支模型获得所述原始图像的定位特征图;对所述定位特征图进行二值化处理,并对二值化处理后的所述定位特征图进行聚类处理,得到每个所述定位点在所述原始图像中的位置信息。3.根据权利要求2所述的方法,其特征在于,所述定位特征图中对应于所述目标对象的指定部位的特征值为1

0,其中,远离所述定位点的位置的特征值趋近于0,靠近所述定位点的位置的特征值趋近于1。4.根据权利要求1

3中任一项所述的方法,其特征在于,所述获取所述目标对象的每个像素点与所述定位点之间的偏移量,包括:基于偏移量分支模型,计算得到所述原始图像的偏移量特征图,所述偏移量特征图中包括:所述目标对象的每个像素点与所述定位点之间的相对位置偏移量。5.根据权利要求1

3中任一项所述的方法,其特征在于,所述根据所述目标像素点集合识别所述原始图像中的所述目标对象,包括:从所述原始...

【专利技术属性】
技术研发人员:熊鹏飞肖坤涛
申请(专利权)人:北京迈格威科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1