The present disclosure relates to an image tag recognition method, device and server, wherein the methods include: constructing a tag visual routing map based on a pre-labeled sample image and a pre-trained image classification model; selecting a batch of sample images from the pre-labeled sample image; and determining each sample image in the batch of sample images by the tag visual routing map. The nearest sample image and the most difficult sample image of the image; the target loss function is constructed according to the image pairs, and the target image classification model is trained according to the target loss function; the recognition image is labeled by the target image classification model. Through the above image tag recognition method, the tag classification can be more refined, indicating the accuracy of tag recognition of target classification model.
【技术实现步骤摘要】
图像标签识别方法、装置及服务器
本公开涉及图像处理
,尤其涉及一种图像标签识别方法、装置及服务器。
技术介绍
深度学习在视频图像、语音识别、自然语言处理等相关领域得到了广泛应用。卷积神经网络作为深度学习的一个重要分支,由于其超强的拟合能力以及端到端的全局优化能力,使得其在目标检测、分类等计算机视觉任务中所得预测结果的精度大幅提升。视频图像等多媒体数据在卷积神经网络中逐层传播时的中间结果也被从模型中剥离出来,作为描述输入数据的特征。这些特征同样被广泛应用在相似人脸检测、视频图像检索等领域。虽然卷积神经网络的中间结果可以被抽离出来作为特征直接应用于相似人脸检测等领域,但是直接从卷积神经网络网络中获取的特征存在如下几个缺点:缺点一、提取的特征粒度较粗,即特征可产生区分效果,但区分效果差;缺点二、该种特征提取方法会在同批样本内选取最困难的样本作为损失参与计算,该种特征提取方法所提取的特征训练的图像分类模型时,模型收敛速度慢。上述两个缺点最终将导致图像分类模型标签识别准确度低、训练难度大的问题。
技术实现思路
为克服相关技术中存在的问题,本专利技术公开提供了一种图像标签识 ...
【技术保护点】
1.一种图像标签识别方法,其特征在于,所述方法包括:基于预先标记的样本图像和预先训练好的图像分类模型,构建标签视觉路由图;从所述预先标记的样本图像中选择一批样本图像;通过所述标签视觉路由图,确定所述批样本图像中各样本图像的最相近样本图像和最困难样本图像;其中,样本图像、样本图像的最相近样本图像以及样本图像的最困难样本图像构成图像对;依据各所述图像对构建目标损失函数,并依据所述目标损失函数训练目标图像分类模型;通过所述目标图像分类模型,对待识别图像进行标签识别。
【技术特征摘要】
1.一种图像标签识别方法,其特征在于,所述方法包括:基于预先标记的样本图像和预先训练好的图像分类模型,构建标签视觉路由图;从所述预先标记的样本图像中选择一批样本图像;通过所述标签视觉路由图,确定所述批样本图像中各样本图像的最相近样本图像和最困难样本图像;其中,样本图像、样本图像的最相近样本图像以及样本图像的最困难样本图像构成图像对;依据各所述图像对构建目标损失函数,并依据所述目标损失函数训练目标图像分类模型;通过所述目标图像分类模型,对待识别图像进行标签识别。2.根据权利要求1所述的方法,其特征在于,所述基于预先标记的样本图像和预先训练好的图像分类模型,构建标签视觉路由图的步骤,包括:通过预先训练好的图像分类模型,对预先标记的各样本图像进行标签预测,得到各所述样本图像对应的目标标签;其中,每个样本图像对应预设数量各目标标签;将所述预先标记的样本图像按照标签进行分组;其中,每个标签对应一个分组;针对每个标签,确定所述目标标签中所述标签的个数;针对每个分组,将所述个数与所述分组中样本图像的个数之商,确定为所述标签到所述分组对应的标签的路由比例;依据各标签间的路由比例,绘制标签视觉路由图。3.根据权利要求2所述的方法,其特征在于,所述通过预先训练好的图像分类模型,对预先标记的各样本图像进行标签预测,得到各所述样本图像对应的目标标签的步骤,包括:所述通过预先训练好的图像分类模型,对预先标记的各样本图像进行标签预测,得到各所述样本图像的预测向量;其中,预测向量中包含多个点,每个点对应一个标签和一个概率值;针对每个预测向量,将所述预测向量中各点的概率值由大到小进行排序;将排序在前的预设数量的概率值对应的标签,确定为所述预测向量对应的样本图像的目标标签。4.根据权利要求1所述的方法,其特征在于,通过所述标签视觉路由图,确定所述批样本图像中各样本图像的最相近样本图像和最困难样本图像的步骤,包括:针对所述批样本图像中的每个样本图像,确定所述样本图像所属的第一标签;确定与所述第一标签间路由比例最小的第二标签,从所述第二标签对应分组中随机提取一个样本图像,作为所述样本图像的最相近样本图像;确定与所述第一标签间路由比例最大的第三标签,从所述第三标签对应分组中随机提取一个样本图像,作为所述样本图像的最困难样本图像。5.根据权利要求1所述的方法,其特征在于:图像对损失平均值计算函数与预设的分类损失函数加权之和,为所述目标损失函数。6.一种图像标签识别装置,其特征在于,所述装置包括:构建模块,被配置为基于预先标记的样本图像和预先训练好的图像分类模型,构建标签视觉路由图;选择模块,被配置为从所述预先标记的样本图像中选择一批样本图像;确定模块,被配置为通过所述标签视觉路由图,确定所述批样本图像中各样本图像的最相近样本图像和最困难样本图像;其中,样本图像、样本图像的最相近样本图像以及样本图像的最困难样本图像构成图像对;训练模块,被配置为依据各所述...
【专利技术属性】
技术研发人员:张志伟,李岩,吴丽军,
申请(专利权)人:北京达佳互联信息技术有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。