一种基于多重感受野的图像分类方法、系统及装置制造方法及图纸

技术编号：18019278 阅读：117 留言：0更新日期：2018-05-23 05:22

本发明专利技术公开了一种基于多重感受野的图像分类方法、系统及装置，包括：建立第一层模型，通过改进的损失函数进行训练，得到调整完后的第一层输出特征；建立第二层模型，通过损失函数进行训练，得到调整完后的第二层输出特征；建立第二层模型，通过进行编码解码训练，得到调整完后的第三层输出特征；根据第三层输出特征按照类别个数进行降维，输出到分类器中进行图像分类识别处理。本发明专利技术通过不同扩张卷积因子获取多个感受野下的图像信息作为下一层网络的输入，并采用堆栈式训练的方法进行逐层训练，使得模型更好地逼近图像特征，而且通过三层模型结构，能更全面地提取图像特征，大大提高图像分类识别的准确率。本发明专利技术可广泛应用于图像分类识别中。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多重感受野的图像分类方法、系统及装置
本专利技术涉及图像分类
，尤其涉及一种基于多重感受野的图像分类方法、系统及装置。
技术介绍
随着科学技术的快速发展，人们愈加期待计算机可以智能地帮助我们完成一些任务，计算机通过自主学习或者人为训练等之后可以模拟人类处理一定的任务，这一
称为人工智能。图像识别是人工智能的一个重要领域，是一种利用计算机对图像进行处理、分析和理解从而识别图像中目标和物体的技术。图像识别技术应用广泛，文字识别、车牌号码识别、人脸识别、场景分类、行人检测、机器人视觉等等，这些都属于图像分类。随着大数据时代的到来，GPU、超级计算机、云计算等这些高性能计算平台的迅猛发展，如何利用结合大数据和高性能计算技术逐渐成为图像分类的主要研究方向。目前，在图像处理领域效果最佳的算法当属卷积神经网络了，但是仍然存在一些问题，比如模型对数据依赖性太强、兼容性较差，卷积操作只能提取局部特征等，导致识别准确率较低。
技术实现思路
为了解决上述技术问题，本专利技术的目的是提供一种能提高分类准确性的基于多重感受野的图像分类方法、系统及装置。本专利技术所采取的技术方案是：一种基于多重感受野的图像分类方法，包括以下步骤：批量输入图像；根据输入图像，建立第一层模型，通过改进的损失函数进行训练，得到调整完后的第一层输出特征；根据第一层输出特征，建立第二层模型，通过损失函数进行训练，得到调整完后的第二层输出特征；根据第二层输出特征，建立第三层模型，通过进行编码解码训练，得到调整完后的第三层输出特征；根据第三层输出特征按照类别个数进行降维，并进行全局平均池化处理，进...
一种基于多重感受野的图像分类方法、系统及装置

【技术保护点】
一种基于多重感受野的图像分类方法，其特征在于，包括以下步骤：批量输入图像；根据输入图像，建立第一层模型，通过改进的损失函数进行训练，得到调整完后的第一层输出特征；根据第一层输出特征，建立第二层模型，通过损失函数进行训练，得到调整完后的第二层输出特征；根据第二层输出特征，建立第三层模型，通过进行编码解码训练，得到调整完后的第三层输出特征；根据第三层输出特征按照类别个数进行降维，并进行全局平均池化处理，进而输出到分类器中进行图像分类识别处理。

【技术特征摘要】
1.一种基于多重感受野的图像分类方法，其特征在于，包括以下步骤：批量输入图像；根据输入图像，建立第一层模型，通过改进的损失函数进行训练，得到调整完后的第一层输出特征；根据第一层输出特征，建立第二层模型，通过损失函数进行训练，得到调整完后的第二层输出特征；根据第二层输出特征，建立第三层模型，通过进行编码解码训练，得到调整完后的第三层输出特征；根据第三层输出特征按照类别个数进行降维，并进行全局平均池化处理，进而输出到分类器中进行图像分类识别处理。2.根据权利要求1所述的一种基于多重感受野的图像分类方法，其特征在于：所述的根据输入图像，建立第一层模型，通过改进的损失函数进行训练，得到调整完后的第一层输出特征，这一步骤具体包括：建立第一层模型，采用扩张卷积因子对输入图像进行扩张卷积处理，得到所有扩张卷积结果的均值，并通过激活函数进行批归一化处理，得到初步第一层输出特征；将初步第一层输出特征进行扩张转置卷积处理，得到卷积均值，并通过激活函数进行批归一化处理，得到还原图像；采用改进的损失函数对第一层模型进行训练，并调整模型参数，进而得到调整完后的第一层输出特征。3.根据权利要求2所述的一种基于多重感受野的图像分类方法，其特征在于：所述的改进的损失函数具体包括：根据输入图像和还原图像，将图像中每4*4像素的区域展开为一个16个元素长的一维向量，并将输入图像和还原图像分别重新存储为16维向量的结构；依次通过不同的扩张卷积因子，计算对应的尺度下每个向量的对比度因子c(x,y)和结构对比因子s(x,y)的乘积，并对每个尺度下的乘积进行累乘，得到多尺度乘积结果；计算最后一个尺度的亮度对比因子l(x,y)：根据亮度对比因子和多尺度乘积结果，计算得到输入图像和还原图像的MS-SSIM值。4.一种基于多重感受野的图像分类系统，其特征在于，包括：图像输入单元，用于批量输入图像；第一层建模单元，用于根据输入图像，建立第一层模型，通过改进的损失函数...

【专利技术属性】
技术研发人员：张金区，鲁玉佳，张肖霞，熊孝天，欧建荣，
申请(专利权)人：华南师范大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人