线性模型稳定学习方法和装置制造方法及图纸

技术编号：22532521 阅读：40 留言：0更新日期：2019-11-13 09:39

本发明专利技术提出一种线性模型稳定学习方法和装置，其中，方法包括：对自变量的初始矩阵的每一列数据进行随机重采样，并根据采样结果生成最终矩阵；将第一样本标签赋予初始矩阵，并将第二样本标签赋予最终矩阵，生成概率二分类器；以及通过概率二分类器并应用概率密度比估计算法得到新的样本权重，并根据新的样本权重调整样本权重，以消除自变量之间的共线性，生成最终线性回归模型。本发明专利技术实施例的方法，通过线性模型稳定方法学习，实现消除自变量之间的共线性的目的，提高了模型的拟合精度，进而能够在多变的数据分布下保持稳定的预测性能。

Stable learning method and device of linear model

The invention proposes a linear model stable learning method and device, wherein, the method comprises: random resampling of each column of data of the initial matrix of independent variable, and generating the final matrix according to the sampling result; assigning the first sample label to the initial matrix, and assigning the second sample label to the final matrix, and generating the probability two classifier; and applying the probability two classifier to generate the probability two classifier The new sample weight is obtained by using the probability density ratio estimation algorithm, and the sample weight is adjusted according to the new sample weight to eliminate the collinearity between independent variables and generate the final linear regression model. The method of the embodiment of the invention realizes the goal of eliminating the collinearity between independent variables through the learning of the linear model stability method, improves the fitting accuracy of the model, and can maintain the stable prediction performance under the changeable data distribution.

全部详细技术资料下载

【技术实现步骤摘要】
线性模型稳定学习方法和装置
本专利技术涉及回归分析和稳定学习
，尤其涉及一种线性模型稳定学习方法和装置。
技术介绍
目前，回归分析是一种经典的统计机器学习方法，其中线性回归模型又因其简洁的数学表达和高效的求解过程至今被广泛应用于刻画因变量于自变量之间的关系。然而，线性回归在模型假设与真实数据产生机制不符的情况下会引入系统性的偏差，这种偏差会被自变量之间的共线性无限制地放大，极大地影响模型的拟合精度。此外，传统的机器学习方法高度依赖数据产生的独立同分布假设，而真实场景下由于数据来源的不可知性，此假设不容易满足，因此在真实环境下的预测性能不稳定。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此，本专利技术的第一个目的在于提出一种线性模型稳定学习方法，该方法通过线性模型稳定方法学习，实现消除自变量之间的共线性的目的，提高了模型的拟合精度，进而能够在多变的数据分布下保持稳定的预测性能。本专利技术的第二个目的在于提出一种线性模型稳定学习装置。本专利技术的第三个目的在于提出一种计算机设备。本专利技术的第四个目的在于提出一种非临时性计算机可读存储介质。为达上述目的，本专利技术第一方面实施例提出了一种线性模型稳定学习方法，包括：对自变量的初始矩阵的每一列数据进行随机重采样，并根据采样结果生成最终矩阵；将第一样本标签赋予所述初始矩阵，并将第二样本标签赋予所述最终矩阵，生成概率二分类器；以及通过所述概率二分类器并应用概率密度比估计算法得到新的样本权重，并根据所述新的样本权重调整样本权重，以消除自变量之间的共线性，生成最终线性回归模型。本专利技...

【技术保护点】
1.一种线性模型稳定学习方法，其特征在于，包括以下步骤：对自变量的初始矩阵的每一列数据进行随机重采样，并根据采样结果生成最终矩阵；将第一样本标签赋予所述初始矩阵，并将第二样本标签赋予所述最终矩阵，生成概率二分类器；以及通过所述概率二分类器并应用概率密度比估计算法得到新的样本权重，并根据所述新的样本权重调整样本权重，以消除自变量之间的共线性，生成最终线性回归模型。

【技术特征摘要】
1.一种线性模型稳定学习方法，其特征在于，包括以下步骤：对自变量的初始矩阵的每一列数据进行随机重采样，并根据采样结果生成最终矩阵；将第一样本标签赋予所述初始矩阵，并将第二样本标签赋予所述最终矩阵，生成概率二分类器；以及通过所述概率二分类器并应用概率密度比估计算法得到新的样本权重，并根据所述新的样本权重调整样本权重，以消除自变量之间的共线性，生成最终线性回归模型。2.根据权利要求1所述的方法，其特征在于，所述最终矩阵的任意两列不相关，且所述最终矩阵的每一列数据的边际分布与所述初始矩阵的每一列数据的边际分布不相同。3.根据权利要求1所述的方法，其特征在于，所述第一样本标签为正样本标签，所述第二样本标签为负样本标签。4.一种线性模型稳定学习装置，其特征在于，所述装置包括：采样模块，用于对自变量的初始矩阵的每一列数据进行随机重采样，并根据采样结果生成最终矩阵；生成模块，用于将第一样本标签赋予所述初始矩阵...

【专利技术属性】
技术研发人员：崔鹏，沈哲言，
申请(专利权)人：清华大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人