图像内容识别方法、装置及终端制造方法及图纸

技术编号:18399618 阅读:26 留言:0更新日期:2018-07-08 19:52
本发明专利技术实施例提供了一种图像内容识别方法、装置及终端,其中,所述方法包括:在对卷积神经网络进行训练的过程中,向卷积神经网络中输入样本图像,其中,所述样本图像用于对所述卷积神经网络进行迭代训练;确定对所述卷积神经网络的已训练迭代次数;基于所述已训练迭代次数,调节损失函数得到目标损失函数;依据所述目标损失函数进行迭代训练,得到目标卷积神经网络;通过所述目标卷积神经网络,对待识别图像进行内容识别。通过本发明专利技术实施例提供的卷积神经网络训练方案,能够更好地拟合到复杂图像样本的分布,减小中间概率值分布的样本图像个数,从而在保证卷积神经网络识别结果准确率的情况下,增加样本的召回率。

【技术实现步骤摘要】
图像内容识别方法、装置及终端
本专利技术涉及图像识别
,特别是涉及一种图像内容识别方法、装置及终端。
技术介绍
深度学习在视频图像、语音识别、自然语言处理等相关领域得到了广泛应用。卷积神经网络作为深度学习的一个重要分支,由于其超强的拟合能力以及端到端的全局优化能力,使得其在目标检测、分类等计算机视觉任务中所得预测结果的精度大幅提升。但是在实际应用中,一般不会直接使用卷积神经网络产生的结果。以一个二分类任务为例,对于一个输入数据卷积神经网络会给出它在某一个类别上的概率。概率阈值会根据具体的应用场景设置,通常情况下会设置一个较高的阈值来获得较高的准确率,但是图像样本的召回率就会相应下降,显然识别结果的准确率与图像样本的召回率成反比。可见,目前迫切需要本领域技术人员迫切解决的技术问题为:如何在保证卷积神经网络识别结果准确率的情况下,增加样本的召回率。
技术实现思路
本专利技术实施例提供一种图像内容识别方法、装置及终端,以解决现有技术中存在的卷积神经网络识别结果准确率与样本的召回率无法兼顾的问题。依据本专利技术的一个方面,提供了一种图像内容识别方法,所述方法包括:在对卷积神经网络进行训练的过程中,向卷积神经网络中输入样本图像,其中,所述样本图像用于对所述卷积神经网络进行迭代训练;确定对所述卷积神经网络的已训练迭代次数;基于所述已训练迭代次数,调节损失函数得到目标损失函数;依据所述目标损失函数进行迭代训练,得到目标卷积神经网络;通过所述目标卷积神经网络,对待识别图像进行内容识别。可选地,所述基于所述已训练迭代次数,调节预设损失函数得到目标损失函数的步骤,包括:提取预设损失函数,判断所述已训练迭代次数是否大于第一预设次数;若否,将所述预设损失函数中的超参数调节为0,得到目标损失函数;若是,将所述预设损失函数中的超参数调节为预设值,得到目标损失函数。可选地,所述预设损失函数如下:sinFocallLoss=-(1-pt)γsin(2π*clip(s-i,0,i/2)/i)log(pt)其中,pt为概率值,γ为超参数,i为迭代次数上限值,s为已训练迭代次数;可选地,所述基于所述已训练迭代次数,调节预设损失函数得到目标损失函数的步骤,包括:确定迭代次数上限值;将所述迭代次数上限值和所述已训练迭代次数,代入所述预设损失函数中,得到目标损失函数。可选地,所述依据所述目标损失函数进行本次迭代训练的步骤,包括:通过所述卷积神经网络确定所述样本图像对应的特征图;将所述特征图进行平均池化,对平均池化后的特征图进行降维处理,得到特征向量;其中,所述第一特征向量中包括多个点,每个点对应一个所述卷积神经网络中的分类标签以及一个概率值;基于所述目标损失函数计算所述卷积神经网络的平均损失值;计算所述目标损失函数在所述特征向量中各点的偏导数得到梯度值,依据所述梯度值对所述卷积神经网络对应的模型参数进行更新。依据本专利技术的另一个方面,提供了一种图像内容识别装置,所述装置包括:输入模块,被配置为在对卷积神经网络进行训练的过程中,向卷积神经网络中输入样本图像,其中,所述样本图像用于对所述卷积神经网络进行迭代训练;确定模块,被配置为确定对所述卷积神经网络的已训练迭代次数;损失函数调节模块,被配置为基于所述已训练迭代次数,调节损失函数得到目标损失函数;训练模块,被配置为依据所述目标损失函数进行本次迭代训练,得到目标卷积神经网络;预测模块,被配置为通过所述目标卷积神经网络,对待识别图像进行内容识别。可选地,所述损失函数调节模块包括:提取子模块,被配置为提取预设损失函数,判断所述已训练迭代次数是否大于第一预设次数;第一调节子模块,被配置为若否,将所述预设损失函数中的超参数调节为0,得到目标损失函数;第二调节子模块,被配置为若是,将所述预设损失函数中的超参数调节为预设值,得到目标损失函数。可选地,所述预设损失函数如下:sinFocallLoss=-(1-pt)γsin(2π*clip(s-i,0,i/2)/i)log(pt)其中,pt为概率值,γ为超参数,i为迭代次数上限值,s为已训练迭代次数;可选地,所述损失函数调节模块包括:上限值确定子模块,被配置为确定迭代次数上限值;代入子模块,被配置为将所述迭代次数上限值和所述已训练迭代次数,代入所述预设损失函数中,得到目标损失函数。可选地,所述训练模块包括:特征图确定子模块,被配置为通过所述卷积神经网络确定所述样本图像对应的特征图;处理子模块,被配置为将所述特征图进行平均池化,对平均池化后的特征图进行降维处理,得到特征向量;其中,所述第一特征向量中包括多个点,每个点对应一个所述卷积神经网络中的分类标签以及一个概率值;计算子模块,被配置为基于所述目标损失函数计算所述卷积神经网络的平均损失值;更新子模块,被配置为计算所述目标损失函数在所述特征向量中各点的偏导数得到梯度值,依据所述梯度值对所述卷积神经网络对应的模型参数进行更新。根据本专利技术的再一方面,提供了一种终端,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的图像内容识别程序,所述图像内容识别程序被所述处理器执行时实现本专利技术中所述的任意一种图像内容识别方法的步骤。根据本专利技术的又一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有图像内容识别程序,所述图像内容识别程序被处理器执行时实现本专利技术中所述的任意一种图像内容识别方法的步骤。与现有技术相比,本专利技术具有以下优点:本专利技术实施例提供的图像内容识别方案,在依据输入的样本图像对卷积神经网络进行迭代训练时,基于迭代次数动态调整每次用于迭代训练的目标损失函数,能够更好地拟合到复杂图像样本的分布,减小中间概率值分布的样本图像个数,从而在保证卷积神经网络识别结果准确率的情况下,增加样本的召回率。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1是根据本专利技术实施例一的一种图像内容识别方法的步骤流程图;图2是根据本专利技术实施例二的一种图像内容识别方法的步骤流程图;图3是根据本专利技术实施例三的一种图像内容识别装置的结构框图;图4是根据本专利技术实施例四的一种终端的结构框图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。实施例一参照图1,示出了本专利技术实施例一的一种图像内容识别方法的步骤流程图。本专利技术实施例的图像内容识别方法可以包括以下步骤:步骤101:在对卷积神经网络进行训练的过程中,向卷积神经网络中输入样本图像。其中,样本图像用于对卷积神经网络进行迭代训练。本专利技术实施例的卷积神经网络可以为多分类内容识别模型,可以识别图像所属的类别;也可以为二分本文档来自技高网...

【技术保护点】
1.一种图像内容识别方法,其特征在于,所述方法包括:在对卷积神经网络进行训练的过程中,向卷积神经网络中输入样本图像,其中,所述样本图像用于对所述卷积神经网络进行迭代训练;确定对所述卷积神经网络的已训练迭代次数;基于所述已训练迭代次数,调节损失函数得到目标损失函数;依据所述目标损失函数进行迭代训练,得到目标卷积神经网络;通过所述目标卷积神经网络,对待识别图像进行内容识别。

【技术特征摘要】
1.一种图像内容识别方法,其特征在于,所述方法包括:在对卷积神经网络进行训练的过程中,向卷积神经网络中输入样本图像,其中,所述样本图像用于对所述卷积神经网络进行迭代训练;确定对所述卷积神经网络的已训练迭代次数;基于所述已训练迭代次数,调节损失函数得到目标损失函数;依据所述目标损失函数进行迭代训练,得到目标卷积神经网络;通过所述目标卷积神经网络,对待识别图像进行内容识别。2.根据权利要求1所述的方法,其特征在于,所述基于所述已训练迭代次数,调节预设损失函数得到目标损失函数的步骤,包括:提取预设损失函数,判断所述已训练迭代次数是否大于第一预设次数;若否,将所述预设损失函数中的超参数调节为0,得到目标损失函数;若是,将所述预设损失函数中的超参数调节为预设值,得到目标损失函数。3.根据权利要求1所述的方法,其特征在于,所述预设损失函数如下:sinFocallLoss=-(1-pt)γsin(2π*clip(s-i,0,i/2)/i)log(pt)其中,pt为概率值,γ为超参数,i为迭代次数上限值,s为已训练迭代次数;4.根据权利要求3所述的方法,其特征在于,所述基于所述已训练迭代次数,调节预设损失函数得到目标损失函数的步骤,包括:确定迭代次数上限值;将所述迭代次数上限值和所述已训练迭代次数,代入所述预设损失函数中,得到目标损失函数。5.根据权利要求1-4任一项所述的方法,其特征在于,依据所述目标损失函数进行一次迭代训练的步骤,包括:通过所述卷积神经网络确定所述样本图像对应的特征图;将所述特征图进行平均池化,对平均池化后的特征图进行降维处理,得到特征向量;其中,所述第一特征向量中包括多个点,每个点对应一个所述卷积神经网络中的分类标签以及一个概率值;基于所述目标损失函数计算所述卷积神经网络的平均损失值;计算所述目标损失函数在所述特征向量中各点的偏导数得到梯度值,依据所述梯度值对所述卷积神经网络对应的模型参数进行更新。6.一种图像内容识别装置,其特征在于,所述装置包括:输入模块,被配置为在对卷积神经网络进行训练的过程中,向卷积神经网络中输入样本图像,其中,所述样本图像用于对所述卷积神经网络进行迭代训练;确定模块,被配置为确定对所述卷积神经网络的已训练迭代次数;损失函数调节模块,被配置为基于所述已训...

【专利技术属性】
技术研发人员:张志伟杨帆
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1