The present invention provides a Bayesian method for non negative L1 norm constrained optimization, which includes step 1. Based on Bayesian theory, the initialized de Lickley prior distribution and mixed exponential power distribution likelihood function are combined to construct a posteriori distribution, and the number of sampling points of the posterior distribution is determined; step two, according to the method, Sampling points, sampling the posterior distribution and obtaining sample samples; step three, calculate the moments of sample samples according to the sample samples, approximate the moments of the Dirichlet posterior distribution through the moment of sample samples; step four, calculate the approximate Dirichlet posterior score according to the moments of the reik posterior distribution of the described Dirichlet. The peak point of cloth is the optimal model parameter. The invention improves the optimization problem with non negative L1 norm constraints, and can effectively improve the performance of the model under the condition of non negative L1 norm constraints.
【技术实现步骤摘要】
一种用于非负L1范数约束优化的贝叶斯方法
本专利技术涉及非负L1范数约束优化
,尤其涉及一种用于非负L1范数约束优化的贝叶斯方法,着重描述了一种基于贝叶斯框架的非负L1范数约束优化方法,从而达到在具有非负L1范数约束场景下提高模型优化性能的目的。
技术介绍
在统计学和机器学习中,优化方法,包括牛顿法、序列二次规划(SQP-SequenceQuadraticProgramming)法、梯度下降(GD-GradientDescent)法、内点(IP-Interior-Point)法等方法,广泛应用于多种实际应用场景并且获得了很好的优化效果。通常情况下,一般的优化问题引入平方残差和(RSS-ResidualSumofSquares)误差,即L2范数的平方作为目标函数,已经被证实可以应用低计算复杂度算法解决。而在实际应用过程中,优化问题可以使用模型残差的任意Lp范数(‖·‖p,p>0,p为有理数)或者多个Lp范数混合的形式作为目标函数。在此基础上,引入约束条件有助于实现数值计算的稳定性并且可以有效提高优化性能。稀疏性约束是一种用于调节目标函数只依赖于一小部分模型参数的常见约束。L0和L1范数约束是最受欢迎的稀疏性约束。L0范数,即‖·‖0,可以被定义为参数向量的非零元素数量,执行最精确的稀疏约束,但是难以在实践中加以实施。L1范数,即‖·‖1,可以被定义为参数向量所有元素绝对值之和的形式,稀疏性约束较强,而且易于应用。因此,为了提高参数向量的稀疏性,实际中通常使用L1范数约束。L1范数正则化作为约束条件,已被应用于稀疏表示、非线性规划、非线性时 ...
【技术保护点】
一种用于非负L1范数约束优化的贝叶斯方法,其特征在于,该方法包括:步骤一、基于贝叶斯理论,将初始化的狄利克雷先验分布以及混合指数幂分布似然函数联合构建后验分布,确定所述后验分布的采样点数;步骤二、根据所述采样点数,对后验分布进行采样,获取采样样本;步骤三、根据所述采样样本,计算采样样本的矩,通过所述采样样本的矩估计近似狄利克雷后验分布的矩;步骤四、根据所述近似狄利克雷后验分布的矩,计算近似狄利克雷后验分布的峰值点,所述峰值点为最优模型参数。
【技术特征摘要】
1.一种用于非负L1范数约束优化的贝叶斯方法,其特征在于,该方法包括:步骤一、基于贝叶斯理论,将初始化的狄利克雷先验分布以及混合指数幂分布似然函数联合构建后验分布,确定所述后验分布的采样点数;步骤二、根据所述采样点数,对后验分布进行采样,获取采样样本;步骤三、根据所述采样样本,计算采样样本的矩,通过所述采样样本的矩估计近似狄利克雷后验分布的矩;步骤四、根据所述近似狄利克雷后验分布的矩,计算近似狄利克雷后验分布的峰值点,所述峰值点为最优模型参数。2.如权利要求1所述的方法,其特征在于,步骤一中,初始化的狄利克雷先验分布的步骤具体包括:将狄利克雷先验分布的参数α=[α1,α2,…,αK]T通过下式进行初始化:α=0.1×[1,1,…,1]T,其中,K是模型参数的维度;同时,设定采样点数L,一般地,L≥1000。3.如权利要求1或2所述的方法,其特征在于,所述步骤二具体包括:根据所述采样点数L,使用包括但不限于拒绝采样、重要性采样或吉布斯采样方法中的一种或多种采样方法对后验分布进行采样,获取L个采样样本。后验分布表示为:p(ω|y,α)∝Likelihood(y|x,ω,η)·Dir(ω|α),其中,ω=[ω1,…,ωK]T是模型参数;x=[x1,…,xN]和y=[y1,…,yN]分别是模型的输入和目标输出;xn和yn,n=1,…,N均是列向量,满足:yn=f(xn;ω)+en,其中,f(·;ω)是系统函数;en是模型误差;yn服从混合指数幂分布,则似然函数Likelihood(y|x,ω,η)可以定义为混合指数幂分布的形式,表示为:其中,EPpi(·|μi,ηi)表示混合指数幂分布的第i个混合成分,i=1,…,I;pi表示幂次;每个混合成分是位置参数为μi,尺度参数为ηi的指数幂分布。若pi=1,则EPpi(·|μi,ηi)等价于拉普拉斯分布;若pi=2,则等价于高斯分布。而狄利克雷先验分布Dir(ω|α)被定义为:其中,K≥2;B(α)是作为归一化约束的多元贝塔函数;对于后验分布采样可以转化为对似然函数和狄利克雷先验的乘积Likelihood(y|x,ω,η)·Dir(ω|α)的采样,得到L个采样样本{ω(1),ω(2),…,ω(L)}。4.如权利要求1-3之一所述的方法,其特征在于,所述步骤三具体包括:根据所述采样样本,计算采样样本的矩,将所述采样样本的矩近似匹配...
【专利技术属性】
技术研发人员:马占宇,谢吉洋,司中威,
申请(专利权)人:北京邮电大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。