图像内容识别方法、装置及终端制造方法及图纸

技术编号：18399618 阅读：26 留言：0更新日期：2018-07-08 19:52

本发明专利技术实施例提供了一种图像内容识别方法、装置及终端，其中，所述方法包括：在对卷积神经网络进行训练的过程中，向卷积神经网络中输入样本图像，其中，所述样本图像用于对所述卷积神经网络进行迭代训练；确定对所述卷积神经网络的已训练迭代次数；基于所述已训练迭代次数，调节损失函数得到目标损失函数；依据所述目标损失函数进行迭代训练，得到目标卷积神经网络；通过所述目标卷积神经网络，对待识别图像进行内容识别。通过本发明专利技术实施例提供的卷积神经网络训练方案，能够更好地拟合到复杂图像样本的分布，减小中间概率值分布的样本图像个数，从而在保证卷积神经网络识别结果准确率的情况下，增加样本的召回率。

全部详细技术资料下载

【技术实现步骤摘要】
图像内容识别方法、装置及终端
本专利技术涉及图像识别
，特别是涉及一种图像内容识别方法、装置及终端。
技术介绍
深度学习在视频图像、语音识别、自然语言处理等相关领域得到了广泛应用。卷积神经网络作为深度学习的一个重要分支，由于其超强的拟合能力以及端到端的全局优化能力，使得其在目标检测、分类等计算机视觉任务中所得预测结果的精度大幅提升。但是在实际应用中，一般不会直接使用卷积神经网络产生的结果。以一个二分类任务为例，对于一个输入数据卷积神经网络会给出它在某一个类别上的概率。概率阈值会根据具体的应用场景设置，通常情况下会设置一个较高的阈值来获得较高的准确率，但是图像样本的召回率就会相应下降，显然识别结果的准确率与图像样本的召回率成反比。可见，目前迫切需要本领域技术人员迫切解决的技术问题为：如何在保证卷积神经网络识别结果准确率的情况下，增加样本的召回率。
技术实现思路
本专利技术实施例提供一种图像内容识别方法、装置及终端，以解决现有技术中存在的卷积神经网络识别结果准确率与样本的召回率无法兼顾的问题。依据本专利技术的一个方面，提供了一种图像内容识别方法，所述方法包括：在对卷积神经网络进行训练的过程中，向卷积神经网络中输入样本图像，其中，所述样本图像用于对所述卷积神经网络进行迭代训练；确定对所述卷积神经网络的已训练迭代次数；基于所述已训练迭代次数，调节损失函数得到目标损失函数；依据所述目标损失函数进行迭代训练，得到目标卷积神经网络；通过所述目标卷积神经网络，对待识别图像进行内容识别。可选地，所述基于所述已训练迭代次数，调节预设损失函数得到目标损失函数的步骤，包括：提取...

【技术保护点】
1.一种图像内容识别方法，其特征在于，所述方法包括：在对卷积神经网络进行训练的过程中，向卷积神经网络中输入样本图像，其中，所述样本图像用于对所述卷积神经网络进行迭代训练；确定对所述卷积神经网络的已训练迭代次数；基于所述已训练迭代次数，调节损失函数得到目标损失函数；依据所述目标损失函数进行迭代训练，得到目标卷积神经网络；通过所述目标卷积神经网络，对待识别图像进行内容识别。

【技术特征摘要】
1.一种图像内容识别方法，其特征在于，所述方法包括：在对卷积神经网络进行训练的过程中，向卷积神经网络中输入样本图像，其中，所述样本图像用于对所述卷积神经网络进行迭代训练；确定对所述卷积神经网络的已训练迭代次数；基于所述已训练迭代次数，调节损失函数得到目标损失函数；依据所述目标损失函数进行迭代训练，得到目标卷积神经网络；通过所述目标卷积神经网络，对待识别图像进行内容识别。2.根据权利要求1所述的方法，其特征在于，所述基于所述已训练迭代次数，调节预设损失函数得到目标损失函数的步骤，包括：提取预设损失函数，判断所述已训练迭代次数是否大于第一预设次数；若否，将所述预设损失函数中的超参数调节为0，得到目标损失函数；若是，将所述预设损失函数中的超参数调节为预设值，得到目标损失函数。3.根据权利要求1所述的方法，其特征在于，所述预设损失函数如下：sinFocallLoss＝-(1-pt)γsin(2π*clip(s-i,0,i/2)/i)log(pt)其中，pt为概率值，γ为超参数，i为迭代次数上限值，s为已训练迭代次数；4.根据权利要求3所述的方法，其特征在于，所述基于所述已训练迭代次数，调节预设损失函数得到目标损失函数的步骤，包括：确定迭代次数上限值；将所述迭代次数上限值和所述已训练迭代次数，代入所述预设损失函数中，得到目标损失函数。5.根据权利要求1-4任一项所述的方法，其特征在于，依据所述目标损失函数进行一次迭代训练的步骤，包括：通过所述卷积神经网络确定所述样本图像对应的特征图；将所述特征图进行平均池化，对平均池化后的特征图进行降维处理，得到特征向量；其中，所述第一特征向量中包括多个点，每个点对应一个所述卷积神经网络中的分类标签以及一个概率值；基于所述目标损失函数计算所述卷积神经网络的平均损失值；计算所述目标损失函数在所述特征向量中各点的偏导数得到梯度值，依据所述梯度值对所述卷积神经网络对应的模型参数进行更新。6.一种图像内容识别装置，其特征在于，所述装置包括：输入模块，被配置为在对卷积神经网络进行训练的过程中，向卷积神经网络中输入样本图像，其中，所述样本图像用于对所述卷积神经网络进行迭代训练；确定模块，被配置为确定对所述卷积神经网络的已训练迭代次数；损失函数调节模块，被配置为基于所述已训...

【专利技术属性】
技术研发人员：张志伟，杨帆，
申请(专利权)人：北京达佳互联信息技术有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人