【技术实现步骤摘要】
基于金字塔池化及长期记忆结构的神经网络模型训练方法
本专利技术涉及一种图像分类
,具体地说是一种基于金字塔池化及长期记忆结构的神经网络模型训练方法。
技术介绍
在由计算机对图像进行自动分类的方法中,如今普遍使用的方法是机器学习方法。由人提供样本t图像数据,然后由训练算法训练一个模型对图像进行分类。机器学习模型的具体训练过程为:首先人工采集样本图像,并对样本图像进行类别标记,将每一个图像标记到正确的类别中,然后将所有样本图像分为训练集和测试集。训练算法使用训练集对模型进行训练,以期模型在未见到过的样本图像中达到最好的分类准确率。训练算法的效果,也就是模型的分类精度,通过将模型在测试集上对样本图像进行分类预测获得。模型在测试集上的分类正确率即为模型的泛化能力,测试集上分类正确率越高,则模型的泛化能力越强。目前,主流的图片分类模型为深度卷积神经网络模型(DCNN模型),基于监督学习训练的深度卷积神经网络模型在一些任务上的表现已经可以超越人类的水平。DCNN模型通过对样本图像数据进行卷积以及非线性运算之后输出图片属于特定类别的概率。在使用DCNN模型进行图像分类的技术中,为提高模型的泛化能力,普遍采用的方法是正则化方法,主要可以分为三类:1、在训练算法的损失函数中添加正则化项,限制模型的复杂程度。2、通过调整神经网络结构,达到对模型正则化的目的。3、在数据预处理阶段进行数据增强,在原始数据分布的邻域内进行训练。以上三种方法全部都是针对于训练集与测试集分布一致情况下提高模型分类能力 ...
【技术保护点】
1.一种基于金字塔池化及长期记忆结构的神经网络模型训练方法,其特征是,包括如下步骤:/na、建立基于金字塔池化及长期记忆结构的神经网络模型,包括源领域编码器M
【技术特征摘要】
1.一种基于金字塔池化及长期记忆结构的神经网络模型训练方法,其特征是,包括如下步骤:
a、建立基于金字塔池化及长期记忆结构的神经网络模型,包括源领域编码器Ms、目标领域编码器Mt、类别分类器C和领域分类器D;所述源领域编码器Ms和所述目标领域编码器Mt的结构相同,其结构包括卷积神经网络结构层、金字塔池化层和长期记忆层;
b、对模型进行预训练,将源领域图像数据输入源领域编码器Ms和类别分类器C内,依据分类损失函数计算分类损失,采用随机梯度下降算法更新源领域编码器Ms和类别分类器C的参数值,训练完成后得到源领域编码器Ms的参数值和类别分类器C的参数值θC,以及任务知识向量t*;
c、对模型进行适配训练,初始化目标领域编码器Mt的参数为以及领域分类器D的参数值,将源领域图像数据通过已经训练好的源领域编码器Ms进行特征抽取,将目标领域图像数据通过目标领域编码器Mt进行特征抽取;然后源领域编码器Ms和目标领域编码器Mt采用相同的任务知识向量t*作为模型的输入参数,目标领域编码器Mt和领域分类器D通过交替随机梯度下降算法进行训练;目标领域编码器Mt和领域分类器D的参数值采用不同的损失函数计算梯度交替更新,训练完成后,可以得到目标领域的编码器Mt和领域分类器D的参数值;
d、对模型进行测试,将目标领域图像数据输入到已经训练完成的目标领域编码器Mt获得编码特征向量Vt3,然后将该编码后的特征向量Vt3输入到在步骤b中已经预训练好参数的类别分类器C中,得到目标领域图像属于各个类别的预测概率。
2.根据权利要求1所述的基于金字塔池化及长期记忆结构的神经网络模型的构建以及训练方法,其特征是,
所述卷积神经网络结构层为卷积神经网络结构,图像经过卷积神经网络结构层输出图像的特征图;
所述金字塔池化层是一个多级池化模块,将所述卷积神经网络结构层输出的特征图进行多个不同级别的池化操作,使得金字塔池化层的输出变为固定长度的特征向量;
所述长期记忆层包括有遗忘门、输入门、输出门和记忆单元;所述遗忘门、输入门和输出门包括有可学习参数的线性变换和非线性激活函数,同时控制流入流出所述记忆单元的信息量;在所述记忆单元中保存了各个样本图像的特征信息,该特征信息为任务知识向量。
3.根据权利要求1所述的基于金字塔池化及长期记忆结构的神经网络模型训练方法,其特征是,所述源领域编码器Ms、目标领域编码器Mt、类别分类器C和领域分类器D的参数随机初始化。
4.根据权利要求1、2或3所述的基于金字塔池化及长期记忆结构的神经网络模型训练方法,其特征是,所述步骤b中...
【专利技术属性】
技术研发人员:张峰,钱辉,花强,董春茹,
申请(专利权)人:河北大学,
类型:发明
国别省市:河北;13
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。