一种基于多重感受野的图像分类方法、系统及装置制造方法及图纸

技术编号:18019278 阅读:117 留言:0更新日期:2018-05-23 05:22
本发明专利技术公开了一种基于多重感受野的图像分类方法、系统及装置,包括:建立第一层模型,通过改进的损失函数进行训练,得到调整完后的第一层输出特征;建立第二层模型,通过损失函数进行训练,得到调整完后的第二层输出特征;建立第二层模型,通过进行编码解码训练,得到调整完后的第三层输出特征;根据第三层输出特征按照类别个数进行降维,输出到分类器中进行图像分类识别处理。本发明专利技术通过不同扩张卷积因子获取多个感受野下的图像信息作为下一层网络的输入,并采用堆栈式训练的方法进行逐层训练,使得模型更好地逼近图像特征,而且通过三层模型结构,能更全面地提取图像特征,大大提高图像分类识别的准确率。本发明专利技术可广泛应用于图像分类识别中。

【技术实现步骤摘要】
一种基于多重感受野的图像分类方法、系统及装置
本专利技术涉及图像分类
,尤其涉及一种基于多重感受野的图像分类方法、系统及装置。
技术介绍
随着科学技术的快速发展,人们愈加期待计算机可以智能地帮助我们完成一些任务,计算机通过自主学习或者人为训练等之后可以模拟人类处理一定的任务,这一
称为人工智能。图像识别是人工智能的一个重要领域,是一种利用计算机对图像进行处理、分析和理解从而识别图像中目标和物体的技术。图像识别技术应用广泛,文字识别、车牌号码识别、人脸识别、场景分类、行人检测、机器人视觉等等,这些都属于图像分类。随着大数据时代的到来,GPU、超级计算机、云计算等这些高性能计算平台的迅猛发展,如何利用结合大数据和高性能计算技术逐渐成为图像分类的主要研究方向。目前,在图像处理领域效果最佳的算法当属卷积神经网络了,但是仍然存在一些问题,比如模型对数据依赖性太强、兼容性较差,卷积操作只能提取局部特征等,导致识别准确率较低。
技术实现思路
为了解决上述技术问题,本专利技术的目的是提供一种能提高分类准确性的基于多重感受野的图像分类方法、系统及装置。本专利技术所采取的技术方案是:一种基于多重感受野的图像分类方法,包括以下步骤:批量输入图像;根据输入图像,建立第一层模型,通过改进的损失函数进行训练,得到调整完后的第一层输出特征;根据第一层输出特征,建立第二层模型,通过损失函数进行训练,得到调整完后的第二层输出特征;根据第二层输出特征,建立第三层模型,通过进行编码解码训练,得到调整完后的第三层输出特征;根据第三层输出特征按照类别个数进行降维,并进行全局平均池化处理,进而输出到分类器中进行图像分类识别处理。作为所述的一种基于多重感受野的图像分类方法的进一步改进,所述的根据输入图像,建立第一层模型,通过改进的损失函数进行训练,得到调整完后的第一层输出特征,这一步骤具体包括:建立第一层模型,采用扩张卷积因子对输入图像进行扩张卷积处理,得到所有扩张卷积结果的均值,并通过激活函数进行批归一化处理,得到初步第一层输出特征;将初步第一层输出特征进行扩张转置卷积处理,得到卷积均值,并通过激活函数进行批归一化处理,得到还原图像;采用改进的损失函数对第一层模型进行训练,并调整模型参数,进而得到调整完后的第一层输出特征。作为所述的一种基于多重感受野的图像分类方法的进一步改进,所述的改进的损失函数具体包括:根据输入图像和还原图像,将图像中每4*4像素的区域展开为一个16个元素长的一维向量,并将输入图像和还原图像分别重新存储为16维向量的结构;依次通过不同的扩张卷积因子,计算对应的尺度下每个向量的对比度因子c(x,y)和结构对比因子s(x,y)的乘积,并对每个尺度下的乘积进行累乘,得到多尺度乘积结果;计算最后一个尺度的亮度对比因子l(x,y):根据亮度对比因子和多尺度乘积结果,计算得到输入图像和还原图像的MS-SSIM值。本专利技术所采用的另一个技术方案是:一种基于多重感受野的图像分类系统,包括:图像输入单元,用于批量输入图像;第一层建模单元,用于根据输入图像,建立第一层模型,通过改进的损失函数进行训练,得到调整完后的第一层输出特征;第二层建模单元,用于根据第一层输出特征,建立第二层模型,通过损失函数进行训练,得到调整完后的第二层输出特征;第三层建模单元,用于根据第二层输出特征,建立第三层模型,通过进行编码解码训练,得到调整完后的第三层输出特征;分类识别单元,用于根据第三层输出特征按照类别个数进行降维,并进行全局平均池化处理,进而输出到分类器中进行图像分类识别处理。作为所述的一种基于多重感受野的图像分类系统的进一步改进,所述的第一层建模单元具体包括:初步计算单元,用于建立第一层模型,采用扩张卷积因子对输入图像进行扩张卷积处理,得到所有扩张卷积结果的均值,并通过激活函数进行批归一化处理,得到初步第一层输出特征;还原图像单元,用于将初步第一层输出特征进行扩张转置卷积处理,得到卷积均值,并通过激活函数进行批归一化处理,得到还原图像;训练单元,用于采用改进的损失函数对第一层模型进行训练,并调整模型参数,进而得到调整完后的第一层输出特征。作为所述的一种基于多重感受野的图像分类系统的进一步改进,所述的训练单元具体包括:结构重组单元,用于根据输入图像和还原图像,将图像中每4*4像素的区域展开为一个16个元素长的一维向量,并将输入图像和还原图像分别重新存储为16维向量的结构;多尺度计算单元,用于依次通过不同的扩张卷积因子,计算对应的尺度下每个向量的对比度因子c(x,y)和结构对比因子s(x,y)的乘积,并对每个尺度下的乘积进行累乘,得到多尺度乘积结果;亮度计算单元,用于计算最后一个尺度的亮度对比因子l(x,y):相似性计算单元,用于根据亮度对比因子和多尺度乘积结果,计算得到输入图像和还原图像的MS-SSIM值。本专利技术所采用的再一个技术方案是:一种基于多重感受野的图像分类装置,包括:存储器,用于存放程序;处理器,用于执行所述程序,所述程序使得所述处理器执行所述的基于多重感受野的图像分类方法。本专利技术的有益效果是:本专利技术一种基于多重感受野的图像分类方法、系统及装置通过不同扩张卷积因子获取多个感受野下的图像信息作为下一层网络的输入,并采用堆栈式训练的方法进行逐层训练,使得模型更好地逼近图像特征,而且通过三层模型结构,能更全面地提取图像特征,大大提高图像分类识别的准确率。附图说明图1是本专利技术一种基于多重感受野的图像分类方法的步骤流程图;图2是本专利技术一种基于多重感受野的图像分类系统的模块方框图。具体实施方式下面结合附图对本专利技术的具体实施方式作进一步说明:参考图1,本专利技术一种基于多重感受野的图像分类方法,包括以下步骤:批量输入图像;根据输入图像,建立第一层模型,通过改进的损失函数进行训练,得到调整完后的第一层输出特征;根据第一层输出特征,建立第二层模型,通过损失函数进行训练,得到调整完后的第二层输出特征;根据第二层输出特征,建立第三层模型,通过进行编码解码训练,得到调整完后的第三层输出特征;根据第三层输出特征按照类别个数进行降维,并进行全局平均池化处理,进而输出到分类器中进行图像分类识别处理。进一步作为优选的实施方式,所述的根据输入图像,建立第一层模型,通过改进的损失函数进行训练,得到调整完后的第一层输出特征,这一步骤具体包括:建立第一层模型,采用扩张卷积因子对输入图像进行扩张卷积处理,得到所有扩张卷积结果的均值,并通过激活函数进行批归一化处理,得到初步第一层输出特征;将初步第一层输出特征进行扩张转置卷积处理,得到卷积均值,并通过激活函数进行批归一化处理,得到还原图像;采用改进的损失函数对第一层模型进行训练,并调整模型参数,进而得到调整完后的第一层输出特征。进一步作为优选的实施方式,所述的改进的损失函数具体包括:根据输入图像和还原图像,将图像中每4*4像素的区域展开为一个16个元素长的一维向量,并将输入图像和还原图像分别重新存储为16维向量的结构;依次通过不同的扩张卷积因子,计算对应的尺度下每个向量的对比度因子c(x,y)和结构对比因子s(x,y)的乘积,并对每个尺度下的乘积进行累乘,得到多尺度乘积结果;计算最后一个尺度的亮度对比因子l(x,y):根据亮度对比因子和多尺本文档来自技高网...
一种基于多重感受野的图像分类方法、系统及装置

【技术保护点】
一种基于多重感受野的图像分类方法,其特征在于,包括以下步骤:批量输入图像;根据输入图像,建立第一层模型,通过改进的损失函数进行训练,得到调整完后的第一层输出特征;根据第一层输出特征,建立第二层模型,通过损失函数进行训练,得到调整完后的第二层输出特征;根据第二层输出特征,建立第三层模型,通过进行编码解码训练,得到调整完后的第三层输出特征;根据第三层输出特征按照类别个数进行降维,并进行全局平均池化处理,进而输出到分类器中进行图像分类识别处理。

【技术特征摘要】
1.一种基于多重感受野的图像分类方法,其特征在于,包括以下步骤:批量输入图像;根据输入图像,建立第一层模型,通过改进的损失函数进行训练,得到调整完后的第一层输出特征;根据第一层输出特征,建立第二层模型,通过损失函数进行训练,得到调整完后的第二层输出特征;根据第二层输出特征,建立第三层模型,通过进行编码解码训练,得到调整完后的第三层输出特征;根据第三层输出特征按照类别个数进行降维,并进行全局平均池化处理,进而输出到分类器中进行图像分类识别处理。2.根据权利要求1所述的一种基于多重感受野的图像分类方法,其特征在于:所述的根据输入图像,建立第一层模型,通过改进的损失函数进行训练,得到调整完后的第一层输出特征,这一步骤具体包括:建立第一层模型,采用扩张卷积因子对输入图像进行扩张卷积处理,得到所有扩张卷积结果的均值,并通过激活函数进行批归一化处理,得到初步第一层输出特征;将初步第一层输出特征进行扩张转置卷积处理,得到卷积均值,并通过激活函数进行批归一化处理,得到还原图像;采用改进的损失函数对第一层模型进行训练,并调整模型参数,进而得到调整完后的第一层输出特征。3.根据权利要求2所述的一种基于多重感受野的图像分类方法,其特征在于:所述的改进的损失函数具体包括:根据输入图像和还原图像,将图像中每4*4像素的区域展开为一个16个元素长的一维向量,并将输入图像和还原图像分别重新存储为16维向量的结构;依次通过不同的扩张卷积因子,计算对应的尺度下每个向量的对比度因子c(x,y)和结构对比因子s(x,y)的乘积,并对每个尺度下的乘积进行累乘,得到多尺度乘积结果;计算最后一个尺度的亮度对比因子l(x,y):根据亮度对比因子和多尺度乘积结果,计算得到输入图像和还原图像的MS-SSIM值。4.一种基于多重感受野的图像分类系统,其特征在于,包括:图像输入单元,用于批量输入图像;第一层建模单元,用于根据输入图像,建立第一层模型,通过改进的损失函数...

【专利技术属性】
技术研发人员:张金区鲁玉佳张肖霞熊孝天欧建荣
申请(专利权)人:华南师范大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1