基于噪声扰动的测试数据预测方法技术

技术编号：10252278 阅读：175 留言：0更新日期：2014-07-24 13:01

本发明专利技术涉及一种基于噪声扰动的测试数据预测方法，包括以下步骤：S1、对测试数据进行预处理，提取测试数据的特征并进行归一化处理；S2、根据测试数据的特征建立预测模型；S3、对预测模型进行参数求解；S4、利用求解后的预测模型对测试数据进行预测；步骤S3包括：选取预测模型的损失函数、将最小化预测模型的损失函数的期望设置为目标函数、计算损失函数的变分上界、优化目标函数及使用迭代复加权最小二乘法以求解目标函数。通过采用本发明专利技术所公开的基于噪声扰动的测试数据预测方法，运用数据增广方法解决了铰链损失函数以及罗杰斯特损失函数在扰动分布下的期望很难计算的问题，为噪声扰动模型学习方法提供了高效、准确的预测模型。

全部详细技术资料下载

【技术实现步骤摘要】
基于噪声扰动的测试数据预测方法
本专利技术涉及计算机应用领域，尤其涉及一种基于噪声扰动的测试数据预测方法。
技术介绍
人工特征噪声扰动方法（artificialfeaturenoisingmethods）是将有限的训练数据按照已知的扰动分布生成一系列扰动数据，扩充为无限个扰动后的训练数据进行训练的方法。在许多扰动方法中，dropout扰动是一种非常有效的控制过拟合的训练方法。Dropout扰动的核心思想是在每一步迭代训练过程中，随机丢弃一些特征，从而生成一系列特征数目较少的样本，在这种扰动后的数据上进行模型学习。由于扰动后的训练数据集规模太大，对模型的时间复杂度提出了很高的要求，因此很不实用。常用的噪声扰动模型学习方法是采用平均化的思想，最小化模型损失函数关于噪声扰动分布的期望，最近许多工作从自适应正则化的角度为这种方法提供了理论上的理解，例如S.Wager等人提出的“Dropouttrainingasadaptiveregularization”,AdvancesinNeuralInformationProcessingSystems(2013)，并且这种方法在多种应用问题如文本分类（例如vanderMaaten等人提出的“Learningwithmarginalizedcorruptedfeatures”，InternationalConferenceonMachineLearning(2013）)、实体识别（例如S.Wang等人提出的“Fastdropouttraining”，InternationalConferenceonMachineLearn...
基于噪声扰动的测试数据预测方法

【技术保护点】
一种基于噪声扰动的测试数据预测方法，其特征在于，包括以下步骤：S1、对测试数据进行预处理，提取所述测试数据的特征并进行归一化处理；S2、根据所述测试数据的特征建立用以对测试数据进行预测的预测模型；S3、对所述预测模型进行参数求解；S4、利用求解后的所述预测模型对测试数据进行预测；其中，步骤S3包括：S3.1、选取所述预测模型的损失函数，将最小化所述预测模型的损失函数的期望设置为目标函数；S3.2、计算所述损失函数的变分上界；S3.3、基于所述损失函数的变分上界，优化所述目标函数；S3.4、使用迭代复加权最小二乘法以求解目标函数。

【技术特征摘要】
1.一种基于噪声扰动的测试数据预测方法，其特征在于，包括以下步骤：S1、对测试数据进行预处理，提取所述测试数据的特征并进行归一化处理；S2、根据所述测试数据的特征建立用以对测试数据进行预测的预测模型；S3、对所述预测模型进行参数求解；S4、利用求解后的所述预测模型对测试数据进行预测；其中，步骤S3包括：S3.1、选取所述预测模型的损失函数，将最小化所述预测模型的损失函数的期望设置为目标函数；S3.2、计算所述损失函数的变分上界；S3.3、基于所述损失函数的变分上界，优化所述目标函数；S3.4、使用迭代复加权最小二乘法以求解目标函数；步骤S3.1中的损失函数为铰链损失函数，所述目标函数为最小化所述预测模型的铰链损失函数的期望；铰链损失函数变分上界的公式如下：其中，θ：＝{w}表示所有需要训练学习得到的模型参数；w为预测模型权值向量；N为样本数目；λn，n∈[N]是增广变量；q(λ)为变分分布；H(λn)是变分分布的熵；定义表示变分分布q的期望，表示噪声扰动分布p的期望；l为模型预测错误时的代价，为经过扰动后的输入特征；为样本n对应的响应变量的伪似然函数；c为正则化参数且取预设值；yn取值+1或-1，表示第n个样本的类别标签；constant为常数；或步骤S3.1中的损失函数为罗杰斯特损失函数，所述目标函数为最小化所述预测模型...

【专利技术属性】
技术研发人员：陈宁，朱军，陈键飞，张钹，
申请(专利权)人：清华大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人