The present disclosure relates to a method and device for identifying objects in an image, an electronic device, and a readable storage medium. The method includes: determining a plurality of candidate regions in the input image and the feature graph of the input image, the size of the feature graph is smaller than the size of the input image, and each candidate region is iteratively adjusted according to the region information and the feature graph of each candidate region, until the iteration termination condition is satisfied. The class probability of each candidate area is identified, and the object area is identified from the plurality of candidate regions according to the class probability of each candidate area. It can be seen that in this public embodiment, each candidate region is iteratively adjusted by the multiple candidate regions and features of the input image, then the object area is identified from the target area obtained, and the regional information of each candidate region is adjusted to improve the accuracy of the region's information and the identified object area. The domain just surrounds the object, thus improving the accuracy of identifying objects.
【技术实现步骤摘要】
识别图像中物体的方法及装置、电子设备、可读存储介质
本公开涉及图像处理
,尤其涉及一种识别图像中物体的方法及装置、电子设备、可读存储介质。
技术介绍
目前,在检测图像中的物体时,过程可以包括:首先,在图像中提取多个候选区域;然后,对每一个候选区域内的物体进行识别。但是,如果确定的候选区域位置不够准确,此时候选区域可能不是刚刚好包围住物体,导致从候选区域中获取的物体特征可能出现偏差,从而影响到识别物体的准确性。
技术实现思路
本公开提供一种识别图像中物体的方法及装置、电子设备、可读存储介质,以解决相关技术中的不足。根据本公开实施例的第一方面,提供一种识别图像中物体的方法,所述方法包括:确定输入图像中的多个候选区域以及所述输入图像的特征图,所述特征图的尺寸小于所述输入图像的尺寸;根据每个候选区域的区域信息和所述特征图对每个候选区域进行迭代调整,直至获得满足迭代终止条件时的每个候选区域的类别概率;根据所述每个候选区域的类别概率从所述多个候选区域中识别出物体区域。可选地,根据每个候选区域的区域信息和所述特征图对每个候选区域进行迭代调整,直至获得满足迭代终止条件时的每个候选区域的类别概率,包括:在每一次迭代调整过程中:通过所述特征图获得每个候选区域的特征向量;根据所述特征向量计算所述候选区域的区域信息调整量;利用所述区域信息调整量对所述候选区域的区域信息进行调整,获得调整后的候选区域。可选地,根据所述特征向量计算所述候选区域的区域信息调整量之后,所述方法还包括:判断所述区域信息调整量是否小于或者等于调整量阈值;如果小于,将调整后的候选区域确定为目标区域;如果大于, ...
【技术保护点】
一种识别图像中物体的方法,其特征在于,所述方法包括:确定输入图像中的多个候选区域以及所述输入图像的特征图,所述特征图的尺寸小于所述输入图像的尺寸;根据每个候选区域的区域信息和所述特征图对每个候选区域进行迭代调整,直至获得满足迭代终止条件时的每个候选区域的类别概率;根据所述每个候选区域的类别概率从所述多个候选区域中识别出物体区域。
【技术特征摘要】
1.一种识别图像中物体的方法,其特征在于,所述方法包括:确定输入图像中的多个候选区域以及所述输入图像的特征图,所述特征图的尺寸小于所述输入图像的尺寸;根据每个候选区域的区域信息和所述特征图对每个候选区域进行迭代调整,直至获得满足迭代终止条件时的每个候选区域的类别概率;根据所述每个候选区域的类别概率从所述多个候选区域中识别出物体区域。2.根据权利要求1所述的识别图像中物体的方法,其特征在于,根据每个候选区域的区域信息和所述特征图对每个候选区域进行迭代调整,直至获得满足迭代终止条件时的每个候选区域的类别概率,包括:在每一次迭代调整过程中:通过所述特征图获得每个候选区域的特征向量;根据所述特征向量计算所述候选区域的区域信息调整量;利用所述区域信息调整量对所述候选区域的区域信息进行调整,获得调整后的候选区域。3.根据权利要求2所述的识别图像中物体的方法,其特征在于,根据所述特征向量计算所述候选区域的区域信息调整量之后,所述方法还包括:判断所述区域信息调整量是否小于或者等于调整量阈值;如果小于,将调整后的候选区域确定为目标区域;如果大于,重复所述迭代调整过程。4.根据权利要求2所述的识别图像中物体的方法,其特征在于,根据所述特征向量计算所述候选区域的区域信息调整量之后,所述方法还包括:判断所述迭代次数是否大于或者等于次数阈值;如果大于或者等于,将调整后的候选区域确定为目标区域;如果小于,重复所述迭代调整过程。5.根据权利要求2所述的识别图像中物体的方法,其特征在于,通过所述特征图获得每个候选区域的特征向量,包括:将每个候选区域按照所述输入图像与所述特征图之间的缩放系数映射至所述特征图中,获得所述每个候选区域对应的特征区域;对每个特征区域进行最大池化操作,获取预设长度的特征向量。6.根据权利要求1所述的识别图像中物体的方法,其特征在于,根据所述每个候选区域的类别概率从所述多个候选区域中识别出物体区域,包括对比每个目标区域的类别概率与概率阈值;若所述类别概率小于或等于所述概率阈值,从所述多个目标区域中剔除所述类别概率对应的候选区域,获取得多个目标区域;对所述多个目标区域进行非极大值抑制处理,获取到物体区域。7.一种识别图像中物体的装置,其特征在于,所述装置包括:特征图确定模块,用于确定输入图像中的多个候选区域以及所述输入图像的特征图,所述特征图的尺寸小于所述输入图像的尺寸;类别概率迭代模块,用于根据每个候选区域的区域信息和所述特征图对每个候选区域进行迭代调整,直至获得满足迭代终止条件时的每个候选区域的类别概率;物体区域识别模块,用于根据所述每个候选区域的类别概率从所述多个候选区域中识别出物体区域。8.根据权利要求7所述的识别图像中物体的装置,其特征在于,所述类别概率迭代模块包括:特征向量获...
【专利技术属性】
技术研发人员:杨松,
申请(专利权)人:北京小米移动软件有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。