图像识别的方法和系统技术方案

技术编号:35102199 阅读:11 留言:0更新日期:2022-10-01 17:09
本说明书提供的图像识别的方法和系统,在目标图像中识别出至少一个候选区域后,基于至少一个候选区域中每个候选区域的尺寸,获取至少一个候选区域对应的总目标图像特征,可以针对不同的候选区域的尺寸,采用不同的特征融合方式,使得提取出候选区域的目标图像特征更加准确,从而提升图像识别的准确率。从而提升图像识别的准确率。从而提升图像识别的准确率。

【技术实现步骤摘要】
图像识别的方法和系统


[0001]本说明书涉及图像识别领域,尤其涉及一种图像识别的方法和系统。

技术介绍

[0002]近年来,随着互联网技术的飞速发展,图像识别的应用领域也越来越广泛,比如,在无人零售领域往往就需要识别出无人零售小店内的商品信息和顾客信息等等。现有的图像识别方法往往采用特征融合的目标检测算法。
[0003]在对现有技术的研究和实践过程中,本专利技术的专利技术人发现无人零售小店内往往包含多种尺度的对象,而在特征融合方式中特征提取参数相对单一,在针对尺度变化较大的目标时会存在较高的漏检率,导致图像识别的准确率较低。
[0004]因此,需要提供一种准确率更高的图像识别的方法和系统。

技术实现思路

[0005]本说明书提供一种准确率更高的图像识别的方法和系统。
[0006]第一方面,本说明书提供一种图像识别方法,包括:获取目标图像,所述目标图像包括至少一个目标对象;从所述目标图像中识别出至少一个候选区域,所述至少一个候选区域对应于至少一个目标对象;基于所述至少一个候选区域中每个候选区域的尺寸,获取所述至少一个候选区域对应的总目标图像特征;以及基于所述总目标图像特征,确定所述至少一个目标对象的对象信息。
[0007]在一些实施例中,所述从所述目标图像中识别出至少一个候选区域,包括:在所述目标图像中识别出至少一个基础候选区域,所述至少一个基础候选区域对应于所述目标对象;对所述目标图像进行多维图像特征提取,得到基础图像特征,所述基础图像特征包括每一维度所对应的图像特征;以及基于所述基础图像特征,在所述基础候选区域中检测出至少一个候选区域。
[0008]在一些实施例中,所述基于所述基础图像特征,在所述基础候选区域中检测出至少一个候选区域,包括:从所述基础图像特征中筛选出目标维度对应的图像特征;将所述基础候选区域投影至所述图像特征对应的特征图,得到目标特征图;在所述目标特征图中进行滑窗处理,以得到至少一个候选区域。
[0009]在一些实施例中,所述在所述目标特征图中进行滑窗处理,以得到至少一个候选区域,包括:基于预设滑窗的尺寸信息,在所述目标特征图中识别出每一预设滑窗与所述基础候选区域的位置关系;基于所述位置关系,确定所述预设滑窗的检测粒度,并基于所述检测粒度,在所述目标特征图中生成至少一个锚框;以及在所述至少一个锚框中筛选出至少一个目标锚框,并将所述目标锚框对应的区域作为候选区域。
[0010]在一些实施例中,所述基于所述检测粒度,在所述目标特征图中生成至少一个锚框,包括:基于所述检测粒度,确定所述预设滑窗对应的滑窗步长;以及基于所述滑窗步长,在所述目标特征图中生成至少一个锚框。
[0011]在一些实施例中,所述在所述至少一个锚框中筛选出至少一个目标锚框,包括:在所述目标特征图中提取出所述至少一个锚框对应的当前图像特征;基于所述当前图像特征,确定所述至少一个锚框对应的候选对象信息;以及基于所述候选对象信息,在所述至少一个锚框中筛选出所述目标锚框,所述目标锚框中包括所述目标对象。
[0012]在一些实施例中,所述基于所述至少一个候选区域中每个候选区域的尺寸,获取所述至少一个候选区域对应的总目标图像特征,包括:基于所述至少一个候选区域中每个候选区域的尺寸,获取所述每个候选区域对应的目标图像特征;将所述目标图像特征进行融合,得到所述至少一个候选区域对应的总目标图像特征。
[0013]在一些实施例中,所述基于所述至少一个候选区域中每个候选区域的尺寸,获取所述每个候选区域对应的目标图像特征,包括:在所述基础图像特征中筛选出预设多个维度的基础图像特征,得到所述至少一个候选区域中每个候选区域对应的区域图像特征集合;以及基于所述每个候选区域的尺寸,对所述区域图像特征集合中的图像特征进行融合,得到所述每个候选区域的目标图像特征。
[0014]在一些实施例中,所述基于所述每个候选区域的尺寸,对所述区域图像特征集合中的图像特征进行融合,得到所述每个候选区域的目标图像特征,包括:当所述候选区域的尺寸小于预设尺寸阈值时,对所述区域图像特征集合中的图像特征进行融合,得到所述候选区域的目标图像特征。
[0015]在一些实施例中,所述对所述区域图像特征集合中的图像特征进行融合,得到所述候选区域的目标图像特征,包括:基于所述候选区域的尺寸,在所述区域图像特征集合中筛选出所述候选区域对应的多个图像特征,得到目标图像特征组;以及对所述目标图像特征组中的图像特征进行融合,以得到所述候选区域的目标图像特征。
[0016]在一些实施例中,所述基于所述候选区域的尺寸,在所述区域图像特征集合中筛选出所述候选区域对应的多个图像特征,得到目标图像特征组,包括:基于所述候选区域的尺寸,确定所述候选区域对应的目标对象的对象尺度;以及在所述区域图像特征集合中筛选出所述对象尺度对应的多个图像特征,得到目标图像特征组。
[0017]在一些实施例中,所述对所述目标图像特征组中的图像特征进行融合,以得到所述候选区域的目标图像特征,包括:在所述目标图像特征组中筛选出待增强图像特征和所述待增强图像特征对应的邻近图像特征;采用所述邻近图像特征对所述待增强图像特征进行语义增强,得到增强后图像特征;以及将所述增强后图像特征和所述区域图像特征集合中除所述待增强图像特征以外的图像特征作为所述候选区域的目标图像特征。
[0018]在一些实施例中,所述在所述目标图像特征组中筛选出待增强图像特征和所述待增强图像特征对应的邻近图像特征,包括:基于所述目标图像特征组中的图像特征对应的图像分辨率,对所述目标图像特征组中的图像特征进行排序;以及基于排序结果,在所述目标图像特征组中筛选出至少一个待增强图像特征和所述待增强图像特征的邻近图像特征。
[0019]在一些实施例,所述采用所述邻近图像特征对所述待增强图像特征进行语义增强,得到增强后图像特征,包括:对所述邻近图像特征进行上采样,得到目标邻近图像特征;将所述目标邻近图像特征与所述待增强图像特征进行融合,得到融合后图像特征;以及对所述待增强图像特征的通道数进行调整,并将调整后待增强图像特征与所述融合后图像特征进行像素相加,得到增强后图像特征。
[0020]在一些实施例中,所述基于所述每个候选区域的尺寸,对所述区域图像特征集合中的图像特征进行融合,得到所述每个候选区域的目标图像特征,包括:当所述候选区域的尺寸大于所述预设尺寸阈值时,将所述区域图像特征集合中的图像特征作为所述候选区域的目标图像特征。
[0021]在一些实施例,所述将所述目标图像特征进行融合,得到所述至少一个候选区域对应的总目标图像特征,包括:对所述目标图像特征进行池化处理,得到池化后图像特征;对所述池化后图像特征进行归一化处理,得到归一化后图像特征;以及将所述归一化后图像特征进行拼接,得到所述至少一个候选区域对应的总目标图像特征。
[0022]在一些实施例,所述对所述目标图像特征进行池化处理,得到池化后图像特征,包括:基于预设区域尺寸,对所述至少一个候选区域进行切分,得到本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别方法,包括:获取目标图像,所述目标图像包括至少一个目标对象;从所述目标图像中识别出至少一个候选区域,所述至少一个候选区域对应于至少一个目标对象;基于所述至少一个候选区域中每个候选区域的尺寸,获取所述至少一个候选区域对应的总目标图像特征;以及基于所述总目标图像特征,确定所述至少一个目标对象的对象信息。2.根据权利要求1所述的图像识别方法,其中,所述从所述目标图像中识别出至少一个候选区域,包括:在所述目标图像中识别出至少一个基础候选区域,所述至少一个基础候选区域对应于所述目标对象;对所述目标图像进行多维图像特征提取,得到基础图像特征,所述基础图像特征包括每一维度所对应的图像特征;以及基于所述基础图像特征,在所述基础候选区域中检测出至少一个候选区域。3.根据权利要求2所述的图像识别方法,其中,所述基于所述基础图像特征,在所述基础候选区域中检测出至少一个候选区域,包括:从所述基础图像特征中筛选出目标维度对应的图像特征;将所述基础候选区域投影至所述图像特征对应的特征图,得到目标特征图;在所述目标特征图中进行滑窗处理,以得到至少一个候选区域。4.根据权利要求3所述的图像识别方法,其中,所述在所述目标特征图中进行滑窗处理,以得到至少一个候选区域,包括:基于预设滑窗的尺寸信息,在所述目标特征图中识别出每一预设滑窗与所述基础候选区域的位置关系;基于所述位置关系,确定所述预设滑窗的检测粒度,并基于所述检测粒度,在所述目标特征图中生成至少一个锚框;以及在所述至少一个锚框中筛选出至少一个目标锚框,并将所述目标锚框对应的区域作为候选区域。5.根据权利要求4所述的图像识别方法,其中,所述基于所述检测粒度,在所述目标特征图中生成至少一个锚框,包括:基于所述检测粒度,确定所述预设滑窗对应的滑窗步长;以及基于所述滑窗步长,在所述目标特征图中生成至少一个锚框。6.根据权利要求4所述的图像识别方法,其中,所述在所述至少一个锚框中筛选出至少一个目标锚框,包括:在所述目标特征图中提取出所述至少一个锚框对应的当前图像特征;基于所述当前图像特征,确定所述至少一个锚框对应的候选对象信息;以及基于所述候选对象信息,在所述至少一个锚框中筛选出所述目标锚框,所述目标锚框中包括所述目标对象。7.根据权利要求2所述的图像识别方法,其中,所述基于所述至少一个候选区域中每个候选区域的尺寸,获取所述至少一个候选区域对应的总目标图像特征,包括:
基于所述至少一个候选区域中每个候选区域的尺寸,获取所述每个候选区域对应的目标图像特征;将所述目标图像特征进行融合,得到所述至少一个候选区域对应的总目标图像特征。8.根据权利要求7所述的图像识别方法,其中,所述基于所述至少一个候选区域中每个候选区域的尺寸,获取所述每个候选区域对应的目标图像特征,包括:在所述基础图像特征中筛选出预设多个维度的基础图像特征,得到所述至少一个候选区域中每个候选区域对应的区域图像特征集合;以及基于所述每个候选区域的尺寸,对所述区域图像特征集合中的图像特征进行融合,得到所述每个候选区域的目标图像特征。9.根据权利要求8所述的图像识别方法,其中,所述基于所述每个候选区域的尺寸,对所述区域图像特征集合中的图像特征进行融合,得到所述每个候选区域的目标图像特征,包括:当所述候选区域的尺寸小于预设尺寸阈值时,对所述区域图像特征集合中的图像特征进行融合,得到所述候选区域的目标图像特征。10.根据权利要求9所述的图像识别方法,其中,所述对所述区域图像特征集合中的图像特征进行融合,得到所述候选区域的目标图像特征,包括:基于所述候选区域的尺寸,在所述区域图像特征集合中筛选出所述候选区域对应的多个图像特征,得到目标图像特征组;以及对所述目标图像特征组中的图像特征进行融合,以得到所述候选区域的目标图像特征。11.根据权利要求10所述的图像识别方法,其中,所述基于所述候选区域的尺寸,在所述区域图像特征集合中筛选出所述候选区域对应的多个图像特征,得到目标图像特征组,包括:基于所述候选区域的尺寸,确定所述候选区域对应的目标对象的对象尺度;以及在所述区域图像特征集合中筛选出所述对象尺度对应的多个图像特征,...

【专利技术属性】
技术研发人员:武文琦
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1