一种图像识别方法、装置、设备及存储介质制造方法及图纸

技术编号:36383980 阅读:17 留言:0更新日期:2023-01-18 09:46
本发明专利技术公开了一种图像识别方法、装置、设备及存储介质。所述方法包括:获取待识别图像;基于预先训练的语义分割网络,确定出所述待识别图像中的遮挡区域、背景区域和待识别主体区域;确定包含所述待识别主体区域的待裁剪图像区域,并将所述待裁剪图像区域的尺寸调整为预设固定尺寸,得到待匹配图像;在预设情况下,确定所述待匹配图像中属于所述遮挡区域的遮挡部分,并在所述预设固定尺寸的N个主体分类模板图像中,分别针对与所述遮挡部分位置相同的图像区域进行遮挡处理,得到N个遮挡模板图像;针对所述N个遮挡模板图像,分别与所述待匹配图像计算图像特征相似度;N≥1;根据计算得到的N个图像特征相似度,确定所述待识别主体的分类。分类。分类。

【技术实现步骤摘要】
一种图像识别方法、装置、设备及存储介质


[0001]本专利技术涉及图像识别
,尤其涉及一种图像识别方法、装置、设备及存储介质。

技术介绍

[0002]在图像识别的业务中,通常需要针对被遮挡的主体进行识别。主体通常可以是某一种物体,例如书本、饮料、手机等等。具体可以是针对被遮挡的主体识别出相应的分类。而主体被遮挡的方式可能是被手部遮挡,也可能是被箱子、纸板、墨迹等等遮挡。
[0003]目前针对被遮挡的主体的识别方法准确率较低。

技术实现思路

[0004]本专利技术提供一种图像识别方法、装置、设备及存储介质,以解决相关技术中的不足。
[0005]根据本专利技术实施例的第一方面,提供一种图像识别方法,包括:
[0006]获取待识别图像;
[0007]基于预先训练的语义分割网络,确定出所述待识别图像中的遮挡区域、背景区域和待识别主体区域;
[0008]确定包含所述待识别主体区域的待裁剪图像区域,并将所述待裁剪图像区域的尺寸调整为预设固定尺寸,得到待匹配图像;
[0009]在预设情况下,确定所述待匹配图像中属于所述遮挡区域的遮挡部分,并在所述预设固定尺寸的N个主体分类模板图像中,分别针对与所述遮挡部分位置相同的图像区域进行遮挡处理,得到N个遮挡模板图像;针对所述N个遮挡模板图像,分别与所述待匹配图像计算图像特征相似度;N≥1;
[0010]根据计算得到的N个图像特征相似度,确定所述待识别主体的分类。
[0011]可选地,所述预设情况包括:所述待匹配图像中,属于所述遮挡区域的遮挡部分面积占比大于或等于预设占比;
[0012]所述方法还包括:
[0013]在所述待匹配图像中属于所述遮挡区域的遮挡部分面积占比小于预设占比的情况下,针对所述N个主体分类模板图像,分别与所述待匹配图像计算图像特征相似度。
[0014]可选地,所述根据计算得到的N个图像特征相似度,确定所述待识别主体的分类,包括:
[0015]在计算得到的N个图像特征相似度中,最高的图像特征相似度大于或等于预设相似度阈值的情况下,将最高图像特征相似度对应的主体分类模板图像所表征的主体分类,确定为所述待识别主体的分类;
[0016]在计算得到的N个图像特征相似度中,最高的图像特征相似度小于所述预设相似度阈值的情况下,确定所述待识别主体的分类为未知分类。
[0017]可选地,所述获取待识别图像,包括:
[0018]获取连续拍摄的多个图像帧,基于目标检测模型进行所述待识别主体的检测和跟踪;
[0019]在确定任一图像帧中,包含所述待识别主体的检测框中心点位于待识别图像区域的情况下,将所述任一图像帧中包含所述待识别主体的预设图像帧区域,确定为待识别图像。
[0020]可选地,所述语义分割网络的训练方法,包括:
[0021]基于已标注的第一图像数据集,训练初始语义分割网络,得到训练完成的第一语义分割网络;
[0022]循环执行以下步骤,直到满足循环停止条件:
[0023]基于未标注的第二图像数据集,利用当前版本的第一语义分割网络进行标注;
[0024]基于已标注的第二图像数据集,继续训练当前版本的第一语义分割网络,得到第二语义分割网络;
[0025]将所述第二语义分割网络确定为当前版本的第一语义分割网络;
[0026]其中,针对循环中每个版本的第一语义分割网络版本,基于已标注的测试图像数据集,确定每个版本的第一语义分割网络的准确率;
[0027]循环结束后,将准确率最高的第一语义分割网络,确定为训练完成的语义分割网络。
[0028]可选地,所述第一图像数据集的构建方法,包括:
[0029]基于获取的主体图像、遮挡图像和背景图像,将所述背景图像确定为底层、将所述主体图像确定为中层、将所述遮挡图像确定为顶层,合成一张第一图像;
[0030]在所述第一图像中,将属于所述背景图像的区域标注为背景区域,将属于所述遮挡图像的区域标注为遮挡区域,将属于所述主体图像的区域标注为主体区域;
[0031]将标注后的第一图像,添加到第一图像数据集中。
[0032]可选地,所述确定包含所述待识别主体区域的待裁剪图像区域,包括:
[0033]确定包含所述待识别主体区域的最小外接矩形。
[0034]可选地,所述针对与所述遮挡部分位置相同的图像区域进行遮挡处理,包括:
[0035]针对与所述遮挡部分位置相同的图像区域,将其中的像素点取值修改为预设值。
[0036]可选地,所述针对所述N个遮挡模板图像,分别与所述待匹配图像计算图像特征相似度,包括:
[0037]针对所述待匹配图像中的所述遮挡部分,进行所述遮挡处理;
[0038]针对所述N个遮挡模板图像,分别与处理后的待匹配图像计算图像特征相似度。
[0039]可选地,所述遮挡区域包括,手部遮挡区域;所述待识别主体包括,待识别商品。
[0040]根据本专利技术实施例的第二方面,提供一种图像识别装置,包括:
[0041]获取单元,用于获取待识别图像;
[0042]分割单元,用于基于预先训练的语义分割网络,确定出所述待识别图像中的遮挡区域、背景区域和待识别主体区域;
[0043]调整单元,用于确定包含所述待识别主体区域的待裁剪图像区域,并将所述待裁剪图像区域的尺寸调整为预设固定尺寸,得到待匹配图像;
[0044]分类单元,用于在预设情况下,确定所述待匹配图像中属于所述遮挡区域的遮挡部分,并在所述预设固定尺寸的N个主体分类模板图像中,分别针对与所述遮挡部分位置相同的图像区域进行遮挡处理,得到N个遮挡模板图像;针对所述N个遮挡模板图像,分别与所述待匹配图像计算图像特征相似度;N≥1;根据计算得到的N个图像特征相似度,确定所述待识别主体的分类。
[0045]可选地,所述预设情况包括:所述待匹配图像中,属于所述遮挡区域的遮挡部分面积占比大于或等于预设占比;
[0046]所述分类单元还用于:
[0047]在所述待匹配图像中属于所述遮挡区域的遮挡部分面积占比小于预设占比的情况下,针对所述N个主体分类模板图像,分别与所述待匹配图像计算图像特征相似度。
[0048]可选地,所述分类单元用于:
[0049]在计算得到的N个图像特征相似度中,最高的图像特征相似度大于或等于预设相似度阈值的情况下,将最高图像特征相似度对应的主体分类模板图像所表征的主体分类,确定为所述待识别主体的分类;
[0050]在计算得到的N个图像特征相似度中,最高的图像特征相似度小于所述预设相似度阈值的情况下,确定所述待识别主体的分类为未知分类。
[0051]可选地,所述获取单元用于:
[0052]获取连续拍摄的多个图像帧,基于目标检测模型进行所述待识别主体的检测和跟踪;
[0053]在确定任一图像帧中,包含所述待识别主体的检测框中心点位于待识别图像区域本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别方法,其特征在于,包括:获取待识别图像;基于预先训练的语义分割网络,确定出所述待识别图像中的遮挡区域、背景区域和待识别主体区域;确定包含所述待识别主体区域的待裁剪图像区域,并将所述待裁剪图像区域的尺寸调整为预设固定尺寸,得到待匹配图像;在预设情况下,确定所述待匹配图像中属于所述遮挡区域的遮挡部分,并在所述预设固定尺寸的N个主体分类模板图像中,分别针对与所述遮挡部分位置相同的图像区域进行遮挡处理,得到N个遮挡模板图像;针对所述N个遮挡模板图像,分别与所述待匹配图像计算图像特征相似度;N≥1;根据计算得到的N个图像特征相似度,确定所述待识别主体的分类。2.根据权利要求1所述的方法,其特征在于,所述预设情况包括:所述待匹配图像中,属于所述遮挡区域的遮挡部分面积占比大于或等于预设占比;所述方法还包括:在所述待匹配图像中属于所述遮挡区域的遮挡部分面积占比小于预设占比的情况下,针对所述N个主体分类模板图像,分别与所述待匹配图像计算图像特征相似度。3.根据权利要求1所述的方法,其特征在于,所述根据计算得到的N个图像特征相似度,确定所述待识别主体的分类,包括:在计算得到的N个图像特征相似度中,最高的图像特征相似度大于或等于预设相似度阈值的情况下,将最高图像特征相似度对应的主体分类模板图像所表征的主体分类,确定为所述待识别主体的分类;在计算得到的N个图像特征相似度中,最高的图像特征相似度小于所述预设相似度阈值的情况下,确定所述待识别主体的分类为未知分类。4.根据权利要求1所述的方法,其特征在于,所述获取待识别图像,包括:获取连续拍摄的多个图像帧,基于目标检测模型进行所述待识别主体的检测和跟踪;在确定任一图像帧中,包含所述待识别主体的检测框中心点位于待识别图像区域的情况下,将所述任一图像帧中包含所述待识别主体的预设图像帧区域,确定为待识别图像。5.根据权利要求1所述的方法,其特征在于,所述语义分割网络的训练方法,包括:基于已标注的第一图像数据集,训练初始语义分割网络,得到训练完成的第一语义分割网络;循环执行以下步骤,直到满足循环停止条件:基于未标注的第二图像数据集,利用当前版本的第一语义分割网络进行标注;基于已标注的第二图像数据集,继续训练当前版本的第一语义分割网络,得到第二语义分割网络;将所述第二语义分割网络确定为当前版本的第一语义分割网络;其中,针对循环中每个版本的第一语义分割网络版本,基于已标注的测试图像数据集,确定每个版本的第一语义分割网络的准确率;循环结束后,将准确率最高的第一语义分...

【专利技术属性】
技术研发人员:钟盼
申请(专利权)人:京东方科技集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1