一种基于卷积神经网络的图像识别方法及装置制造方法及图纸

技术编号:19935077 阅读:26 留言:0更新日期:2018-12-29 04:51
本发明专利技术公开了一种基于卷积神经网络的图像识别方法及装置。该方法包括:采用预设卷积神经网络确定训练图像的第一概率值;获取预设软间隔归一化指数函数的间隔值,根据间隔值、第一概率值以及预设软间隔归一化指数函数,确定训练图像的第二概率值;根据第二概率值和预设互熵损失函数,确定损失值;判断损失值是否收敛,如果是,将预设卷积神经网络作为收敛卷积神经网络;或,如果否,更新预设卷积神经网络的网络参数,采用更新后的预设卷积神经网络重新执行前述步骤,直至损失值收敛,将当前的更新后的预设卷积神经网络作为收敛卷积神经网络;采用收敛卷积神经网络对待检测图像进行图像识别。采用该方法对未知图像进行识别,识别结果的准确度更高。

【技术实现步骤摘要】
一种基于卷积神经网络的图像识别方法及装置
本专利技术涉及图像识别
,尤其涉及一种基于卷积神经网络的图像识别方法及装置。
技术介绍
卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现,例如,利用卷积神经网络进行图像识别。现有技术中,在采用卷积神经网络对未知图像进行图像识别时,通常先采用已知图像对卷积神经网络进行训练,生成收敛卷积神经网络,之后采用收敛卷积神经网络即可对未知图像进行图像识别,其中,未知图像和已知图像的含义相反,两者的具体含义取决于图像识别的具体识别内容,例如,如果需要对图像的图像类别进行识别,则未知图像为图像类别不确定的图像,已知图像为图像类别已经确定的图像;如果需要对图像的年龄进行识别,则未知图像为年龄不确定的图像,已知图像为年龄已经确定的图像;如果需要对人脸图像进行验证,则未知图像为人脸类别不确定的图像,已知图像为人脸类别已经确定的图像。识别内容为其它内容时,未知图像和已知图像的含义类同,此处不再一一列举。不过,现有技术中,对卷积神经网络进行训练时,不会考虑图像特征的判别性,基于这样的卷积神经网络对图像进行图像识别时,图像识别结果的准确度较低。综上可知,现有的基于卷积神经网络的图像识别方法,图像识别结果的准确度较低,适用性较差。
技术实现思路
本专利技术提供了一种基于卷积神经网络的图像识别方法及装置,以解决现有的基于卷积神经网络的图像识别方法,图像识别结果的准确度较低,适用性较差的问题。第一方面,本专利技术提供了一种基于卷积神经网络的图像识别方法,该图像识别方法包括:采用预设卷积神经网络确定训练图像的第一概率值;获取预设软间隔归一化指数函数的间隔值,根据所述间隔值、所述第一概率值以及所述预设软间隔归一化指数函数,确定所述训练图像的第二概率值;根据所述第二概率值和预设互熵损失函数,确定损失值;判断所述损失值是否收敛,如果是,将所述预设卷积神经网络作为收敛卷积神经网络;或,如果否,更新所述预设卷积神经网络的网络参数,采用更新后的预设卷积神经网络重新执行确定训练图像的第一概率值的步骤以及该步骤的后续步骤,直至所述损失值收敛,将当前的更新后的预设卷积神经网络作为收敛卷积神经网络;采用所述收敛卷积神经网络对待检测图像进行图像识别。进一步,采用预设卷积神经网络确定训练图像的第一概率值的过程,具体包括:随机选取n帧训练图像输入预设卷积神经网络,获取所述预设卷积神经网络的倒数第二层全连接层输出的每一帧训练图像的图像特征;将每一帧训练图像的图像特征输入至所述预设卷积神经网络的最后一层全连接层,根据下述预设第一关系式,生成该帧训练图像属于所有图像类别中每一个图像类别的第一概率值;其中,所述预设卷积神经网络的最后一层全连接层包含Q个分类器,每个分类器对应所有图像类别中的一个图像类别,Q为正整数;wk为所述预设卷积神经网络的最后一层全连接层的网络参数,即所述预设卷积神经网络的最后一层全连接层包含的编号为k的分类器,编号为k的分类器对应所有图像类别中编号为k的图像类别,k=1,2,…,Q;T为向量转置符号;xi表示编号为i的训练图像的图像特征,i=1,2,…,n,n为正整数;zik表示编号为i的训练图像属于编号为k的图像类别的第一概率值。进一步,获取预设软间隔归一化指数函数的间隔值,根据所述间隔值、所述第一概率值以及所述预设软间隔归一化指数函数,确定所述训练图像的第二概率值的过程,具体包括:获取输入的预设软间隔归一化指数函数的间隔值;根据所述间隔值、所述第一概率值以及下述预设软间隔归一化指数函数,确定每一帧所述训练图像属于所有图像类别中每一个图像类别的第二概率值;其中,zik表示编号为i的训练图像属于编号为k的图像类别的第一概率值,i=1,2,…,n,n为正整数,k=1,2,…,Q,Q为正整数;zij表示编号为i的训练图像属于编号为j的图像类别的第一概率值,j=1,2,…,Q且j≠k;m表示所述间隔值;sik表示编号为i的训练图像属于编号为k的图像类别的第二概率值。进一步,根据所述第二概率值和预设互熵损失函数,确定损失值的过程,具体包括:根据所述第二概率值和下述预设互熵损失函数,确定损失值;其中,sik表示编号为i的训练图像属于编号为k的图像类别的第二概率值,1{y=k}为指示函数,y=k成立时,该指示函数的值为1,y=k不成立时,该指示函数的值为0;n为正整数,表示每次随机选取的训练图像的总数;Q为正整数,其值等于预设卷积神经网络的最后一层全连接层中包含的分类器的总数。进一步,采用所述收敛卷积神经网络对待检测图像进行图像识别的过程,具体包括:采用所述收敛卷积神经网络提取待检测图像的目标图像特征;获取所述收敛卷积神经网络的最后一层全连接层的目标网络参数;根据所述目标图像特征和所述目标网络参数,以及下述预设第二关系式,确定所述待检测图像对应的目标图像类别;其中,w′k(k=1,2,…,Q)表示所述收敛卷积神经网络的最后一层全连接层的目标网络参数,Q为正整数,其值等于所述收敛卷积神经网络的最后一层全连接层中包含的分类器的总数;T为向量转置符号;x表示所述目标图像特征;y表示所述待检测图像对应的目标图像类别的编号。第二方面,本专利技术还提供了一种基于卷积神经网络的图像识别装置,该图像识别装置包括:第一概率值确定模块,用于采用预设卷积神经网络确定训练图像的第一概率值;第二概率值确定模块,用于获取预设软间隔归一化指数函数的间隔值,根据所述间隔值、所述第一概率值以及所述预设软间隔归一化指数函数,确定所述训练图像的第二概率值;损失值确定模块,用于根据所述第二概率值和预设互熵损失函数,确定损失值;收敛卷积神经网络确定模块,用于判断所述损失值是否收敛,如果是,将所述预设卷积神经网络作为收敛卷积神经网络;或,如果否,更新所述预设卷积神经网络的网络参数,采用更新后的预设卷积神经网络重新执行确定训练图像的第一概率值的步骤以及该步骤的后续步骤,直至所述损失值收敛,将当前的更新后的预设卷积神经网络作为收敛卷积神经网络;图像识别模块,用于采用所述收敛卷积神经网络对待检测图像进行图像识别。进一步,所述第一概率值确定模块具体用于:随机选取n帧训练图像输入预设卷积神经网络,获取所述预设卷积神经网络的倒数第二层全连接层输出的每一帧训练图像的图像特征;将每一帧训练图像的图像特征输入至所述预设卷积神经网络的最后一层全连接层,根据下述预设第一关系式,生成该帧训练图像属于所有图像类别中每一个图像类别的第一概率值;其中,所述预设卷积神经网络的最后一层全连接层包含Q个分类器,每个分类器对应所有图像类别中的一个图像类别,Q为正整数;wk为所述预设卷积神经网络的最后一层全连接层的网络参数,即所述预设卷积神经网络的最后一层全连接层包含的编号为k的分类器,编号为k的分类器对应所有图像类别中编号为k的图像类别,k=1,2,…,Q;T为向量转置符号;xi表示编号为i的训练图像的图像特征,i=1,2,…,n,n为正整数;zik表示编号为i的训练图像属于编号为k的图像类别的第一概率值。进一步,所述第二概率值确定模块具体用于:获取输入的预设软间隔归一化指数函本文档来自技高网...

【技术保护点】
1.一种基于卷积神经网络的图像识别方法,其特征在于,包括:采用预设卷积神经网络确定训练图像的第一概率值;获取预设软间隔归一化指数函数的间隔值,根据所述间隔值、所述第一概率值以及所述预设软间隔归一化指数函数,确定所述训练图像的第二概率值;根据所述第二概率值和预设互熵损失函数,确定损失值;判断所述损失值是否收敛,如果是,将所述预设卷积神经网络作为收敛卷积神经网络;或,如果否,更新所述预设卷积神经网络的网络参数,采用更新后的预设卷积神经网络重新执行确定训练图像的第一概率值的步骤以及该步骤的后续步骤,直至所述损失值收敛,将当前的更新后的预设卷积神经网络作为收敛卷积神经网络;采用所述收敛卷积神经网络对待检测图像进行图像识别。

【技术特征摘要】
1.一种基于卷积神经网络的图像识别方法,其特征在于,包括:采用预设卷积神经网络确定训练图像的第一概率值;获取预设软间隔归一化指数函数的间隔值,根据所述间隔值、所述第一概率值以及所述预设软间隔归一化指数函数,确定所述训练图像的第二概率值;根据所述第二概率值和预设互熵损失函数,确定损失值;判断所述损失值是否收敛,如果是,将所述预设卷积神经网络作为收敛卷积神经网络;或,如果否,更新所述预设卷积神经网络的网络参数,采用更新后的预设卷积神经网络重新执行确定训练图像的第一概率值的步骤以及该步骤的后续步骤,直至所述损失值收敛,将当前的更新后的预设卷积神经网络作为收敛卷积神经网络;采用所述收敛卷积神经网络对待检测图像进行图像识别。2.如权利要求1所述的图像识别方法,其特征在于,采用预设卷积神经网络确定训练图像的第一概率值的过程,具体包括:随机选取n帧训练图像输入预设卷积神经网络,获取所述预设卷积神经网络的倒数第二层全连接层输出的每一帧训练图像的图像特征;将每一帧训练图像的图像特征输入至所述预设卷积神经网络的最后一层全连接层,根据下述预设第一关系式,生成该帧训练图像属于所有图像类别中每一个图像类别的第一概率值;其中,所述预设卷积神经网络的最后一层全连接层包含Q个分类器,每个分类器对应所有图像类别中的一个图像类别,Q为正整数;wk为所述预设卷积神经网络的最后一层全连接层的网络参数,即所述预设卷积神经网络的最后一层全连接层包含的编号为k的分类器,编号为k的分类器对应所有图像类别中编号为k的图像类别,k=1,2,…,Q;T为向量转置符号;xi表示编号为i的训练图像的图像特征,i=1,2,…,n,n为正整数;zik表示编号为i的训练图像属于编号为k的图像类别的第一概率值。3.如权利要求2所述的图像识别方法,其特征在于,获取预设软间隔归一化指数函数的间隔值,根据所述间隔值、所述第一概率值以及所述预设软间隔归一化指数函数,确定所述训练图像的第二概率值的过程,具体包括:获取输入的预设软间隔归一化指数函数的间隔值;根据所述间隔值、所述第一概率值以及下述预设软间隔归一化指数函数,确定每一帧所述训练图像属于所有图像类别中每一个图像类别的第二概率值;其中,zik表示编号为i的训练图像属于编号为k的图像类别的第一概率值,i=1,2,…,n,n为正整数,k=1,2,…,Q,Q为正整数;zij表示编号为i的训练图像属于编号为j的图像类别的第一概率值,j=1,2,…,Q且j≠k;m表示所述间隔值;sik表示编号为i的训练图像属于编号为k的图像类别的第二概率值。4.如权利要求3所述的图像识别方法,其特征在于,根据所述第二概率值和预设互熵损失函数,确定损失值的过程,具体包括:根据所述第二概率值和下述预设互熵损失函数,确定损失值;其中,sik表示编号为i的训练图像属于编号为k的图像类别的第二概率值,1{y=k}为指示函数,y=k成立时,该指示函数的值为1,y=k不成立时,该指示函数的值为0;n为正整数,表示每次随机选取的训练图像的总数;Q为正整数,其值等于预设卷积神经网络的最后一层全连接层中包含的分类器的总数。5.如权利要求4所述的图像识别方法,其特征在于,采用所述收敛卷积神经网络对待检测图像进行图像识别的过程,具体包括:采用所述收敛卷积神经网络提取待检测图像的目标图像特征;获取所述收敛卷积神经网络的最后一层全连接层的目标网络参数;根据所述目标图像特征和所述目标网络参数,以及下述预设第二关系式,确定所述待检测图像对应的目标图像类别;其中,w′k(k=1,2,…,Q)表示所述收敛卷积神经网络的最后一层全连接层的目标网络参数,Q为正整数,其值等于所述收敛卷积神经网络的最后一层全连接层中包含的分类器的总数;T为向量转置符号;x表示所述目标图...

【专利技术属性】
技术研发人员:王睿
申请(专利权)人:北京中科奥森数据科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1