一种图像识别方法、装置、设备及存储介质制造方法及图纸

技术编号：36383980 阅读：17 留言：0更新日期：2023-01-18 09:46

本发明专利技术公开了一种图像识别方法、装置、设备及存储介质。所述方法包括：获取待识别图像；基于预先训练的语义分割网络，确定出所述待识别图像中的遮挡区域、背景区域和待识别主体区域；确定包含所述待识别主体区域的待裁剪图像区域，并将所述待裁剪图像区域的尺寸调整为预设固定尺寸，得到待匹配图像；在预设情况下，确定所述待匹配图像中属于所述遮挡区域的遮挡部分，并在所述预设固定尺寸的N个主体分类模板图像中，分别针对与所述遮挡部分位置相同的图像区域进行遮挡处理，得到N个遮挡模板图像；针对所述N个遮挡模板图像，分别与所述待匹配图像计算图像特征相似度；N≥1；根据计算得到的N个图像特征相似度，确定所述待识别主体的分类。分类。分类。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像识别方法、装置、设备及存储介质

[0001]本专利技术涉及图像识别
，尤其涉及一种图像识别方法、装置、设备及存储介质。

技术介绍

[0002]在图像识别的业务中，通常需要针对被遮挡的主体进行识别。主体通常可以是某一种物体，例如书本、饮料、手机等等。具体可以是针对被遮挡的主体识别出相应的分类。而主体被遮挡的方式可能是被手部遮挡，也可能是被箱子、纸板、墨迹等等遮挡。
[0003]目前针对被遮挡的主体的识别方法准确率较低。

技术实现思路

[0004]本专利技术提供一种图像识别方法、装置、设备及存储介质，以解决相关技术中的不足。
[0005]根据本专利技术实施例的第一方面，提供一种图像识别方法，包括：
[0006]获取待识别图像；
[0007]基于预先训练的语义分割网络，确定出所述待识别图像中的遮挡区域、背景区域和待识别主体区域；
[0008]确定包含所述待识别主体区域的待裁剪图像区域，并将所述待裁剪图像区域的尺寸调整为预设固定尺寸，得到待匹配图像；
[0009]在预设情况下，确定所述待匹配图像中属于所述遮挡区域的遮挡部分，并在所述预设固定尺寸的N个主体分类模板图像中，分别针对与所述遮挡部分位置相同的图像区域进行遮挡处理，得到N个遮挡模板图像；针对所述N个遮挡模板图像，分别与所述待匹配图像计算图像特征相似度；N≥1；
[0010]根据计算得到的N个图像特征相似度，确定所述待识别主体的分类。
[0011]可选地，所述预设情况包括：所述...

【技术保护点】

【技术特征摘要】
1.一种图像识别方法，其特征在于，包括：获取待识别图像；基于预先训练的语义分割网络，确定出所述待识别图像中的遮挡区域、背景区域和待识别主体区域；确定包含所述待识别主体区域的待裁剪图像区域，并将所述待裁剪图像区域的尺寸调整为预设固定尺寸，得到待匹配图像；在预设情况下，确定所述待匹配图像中属于所述遮挡区域的遮挡部分，并在所述预设固定尺寸的N个主体分类模板图像中，分别针对与所述遮挡部分位置相同的图像区域进行遮挡处理，得到N个遮挡模板图像；针对所述N个遮挡模板图像，分别与所述待匹配图像计算图像特征相似度；N≥1；根据计算得到的N个图像特征相似度，确定所述待识别主体的分类。2.根据权利要求1所述的方法，其特征在于，所述预设情况包括：所述待匹配图像中，属于所述遮挡区域的遮挡部分面积占比大于或等于预设占比；所述方法还包括：在所述待匹配图像中属于所述遮挡区域的遮挡部分面积占比小于预设占比的情况下，针对所述N个主体分类模板图像，分别与所述待匹配图像计算图像特征相似度。3.根据权利要求1所述的方法，其特征在于，所述根据计算得到的N个图像特征相似度，确定所述待识别主体的分类，包括：在计算得到的N个图像特征相似度中，最高的图像特征相似度大于或等于预设相似度阈值的情况下，将最高图像特征相似度对应的主体分类模板图像所表征的主体分类，确定为所述待识别主体的分类；在计算得到的N个图像特征相似度中，最高的图像特征相似度小于所述预设相似度阈值的情况下，确定所述待识别主体的分类为未知分类。4.根据权利要求1所述的方法，其特征在于，所述获取待识别图像，包括：获取连续拍摄的多个图像帧，基于目标检测模型进行所述待识别主体的检测和跟踪；在确定任一图像帧中，包含所述待识别主体的检测框中心点位于待识别图像区域的情况下，将所述任一图像帧中包含所述待识别主体的预设图像帧区域，确定为待识别图像。5.根据权利要求1所述的方法，其特征在于，所述语义分割网络的训练方法，包括：基于已标注的第一图像数据集，训练初始语义分割网络，得到训练完成的第一语义分割网络；循环执行以下步骤，直到满足循环停止条件：基于未标注的第二图像数据集，利用当前版本的第一语义分割网络进行标注；基于已标注的第二图像数据集，继续训练当前版本的第一语义分割网络，得到第二语义分割网络；将所述第二语义分割网络确定为当前版本的第一语义分割网络；其中，针对循环中每个版本的第一语义分割网络版本，基于已标注的测试图像数据集，确定每个版本的第一语义分割网络的准确率；循环结束后，将准确率最高的第一语义分...

【专利技术属性】
技术研发人员：钟盼，
申请(专利权)人：京东方科技集团股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人