图像识别方法、装置及电子设备制造方法及图纸

技术编号：38842219 阅读：11 留言：0更新日期：2023-09-17 09:55

本申请实施例提供了一种图像识别方法、装置及电子设备，包括：通过目标图像分类模型中的变换器获取各图像块对应的第一语义特征；通过目标图像分类模型中的图像块分类模块，获取图像块的第一分类概率，并通过目标图像分类模型中的图像分类模块，获取待识别图像为各种不适类型的图像的第二分类概率；通过目标图像分类模型中的输出层，基于各第一分类概率和第二分类概率中的至少一项，获取待识别图像的图像识别结果。该方案利用了待识别图像的局部特征，提高对包含较小不适区域的图像的召回率。提高对包含较小不适区域的图像的召回率。提高对包含较小不适区域的图像的召回率。

全部详细技术资料下载

【技术实现步骤摘要】
图像识别方法、装置及电子设备

[0001]本申请涉及计算机
，具体而言，本申请涉及一种图像识别方法、装置及电子设备。

技术介绍

[0002]随着移动互联网的高速发展，人们花费了大量时间阅读信息流资讯或者观看短视频，也有越来越多的人做起了自媒体，创作了大量作品。但是其中创作的内容质量参差不齐，存在封面图或者视频内容包含一些引起用户不适感的图像，严重影响了用户的观看体验，这类图像可以统称为不适图像。识别出不适图像进行过滤对提升内容生态、提升用户阅读体验至关重要。
[0003]目前，很多内容提供平台会采用人工智能（AI）模型来对识别不适图像，然而有的图像的不适区域较小，面积区域更大的背景很容易使模型无法识别出不适图像。

技术实现思路

[0004]本申请的目的旨在至少能解决上述的技术缺陷之一，本申请实施例所提供的技术方案如下：第一方面，本申请实施例提供了一种图像识别方法，包括：将待识别图像分割为至少两个图像块，并将各图像块输入目标图像分类模型，通过目标图像分类模型中的变换器获取各图像块对应的第一语义特征；通过目标图像分类模型中的图像块分类模块，基于每一图像块对应的第一语义特征，获取图像块为各种不适类型的图像块的第一分类概率，并通过目标图像分类模型中的图像分类模块，基于各图像块对应的第一语义特征，获取待识别图像为各种不适类型的图像的第二分类概率；通过目标图像分类模型中的输出层，基于各第一分类概率和第二分类概率中的至少一项，获取待识别图像的图像识别结果。
[0005]在本申请的一种可选实施例...

【技术保护点】

【技术特征摘要】
1.一种图像识别方法，其特征在于，包括：将待识别图像分割为至少两个图像块，并将各图像块输入目标图像分类模型，通过所述目标图像分类模型中的变换器获取各图像块对应的第一语义特征；通过所述目标图像分类模型中的图像块分类模块，基于每一图像块对应的第一语义特征，获取所述图像块为各种不适类型的图像块的第一分类概率，并通过所述目标图像分类模型中的图像分类模块，基于各图像块对应的第一语义特征，获取所述待识别图像为各种不适类型的图像的第二分类概率；通过所述目标图像分类模型中的输出层，基于各第一分类概率和所述第二分类概率中的至少一项，获取所述待识别图像的图像识别结果。2.根据权利要求1所述的方法，其特征在于，所述各种不适类型通过以下方式确定：获取第一预设数量的图像，并获取各图像的第二语义特征；基于各第二语义特征对各图像进行聚类，得到多个图像簇；对于每一图像簇，基于所述图像簇中的第二预设数量的图像确定所述图像簇对应的不适类型，将各图像簇对应的不适类型确定为所述各个不适类型。3.根据权利要求1所述的方法，其特征在于，所述通过所述目标图像分类模型中的图像分类模块基于各图像块对应的第一语义特征，获取所述待识别图像为各种不适类型的图像的第二分类概率，包括：对各图像块对应的第一语义特征进行均值处理，得到第三语义特征；基于所述第三语义特征获取所述第二分类概率；所述通过所述目标图像分类模型中的输出层基于各第一分类概率和所述第二分类概率中的至少一项，获取所述待识别图像的图像识别结果，包括：对各第一分类概率进行均值处理，得到第四分类概率，并获取所述第二分类概率和所述第四分类概率对应的第一预设权重；对所述第二分类概率和所述第四分类概率按第一预设权重进行加权处理，得到所述第三分类概率；基于所述第三分类概率获取所述待识别图像的图像识别结果。4.根据权利要求1
‑
3中任一项所述的方法，其特征在于，所述目标图像分类模型通过如下方式获取：获取第三预设数量的样本图像，并对每一样本图像进行分割得到对应的样本图像块，每一样本图像携带有用于指示所述样本图像是否为各不适类型的图像的标签，若是，所述标签还指示对应的不适类型；每一样本图像块携带有用于指示所述样本图像块是否为各不适类型的图像块的标签，若是，所述标签还指示对应的不适类型；利用各样本图像对初始图像分类模型迭代执行以下训练操作，直至总损失值不大于预设阈值得到所述目标图像分类模型：将所述样本图像对应的样本图像块输入所述初始图像分类模型，得到各图像块为各种不适类型的图像块的第一预测分类概率和所述样本图像为各种不适类型的图像的第二预测分类概率；基于每一样本图像块的标签和第一预测分类概率获取所述样本图像块对应的第一损失值，基于所述样本图像的标签和第二预...

【专利技术属性】
技术研发人员：陈少华，余亭浩，王赟豪，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人