【技术实现步骤摘要】
一种向量化分布式并行的TMCMC随机抽样算法
本专利技术属于贝叶斯方法中的随机抽样算法技术,具体地讲涉及一种向量化分布式并行的TMCMC随机抽样算法。
技术介绍
在采用贝叶斯理论进行统计推断时,从理论上说,对于任何先验分布,只需根据贝叶斯理论,计算出所需后验分布的特性,如后验分布的矩(后验均值、后验方差)、后验概率密度函数等;其本质就是计算后验分布涉及函数的高维积分。但是在实际应用中,很多时候监测资料较少,往往未知参数的后验分布多呈高维、复杂的非常见分布,计算十分困难。随机抽样的方法可以突破这一原本极为困难的计算问题,它通过模拟的方式对高维积分进行计算,进而解决了十分复杂的高维积分计算问题,而且随机抽样方法不论监测资料的多少,都可以进行抽样,进而估算出后验概率密度函数,这大大促进了贝叶斯方法的在各领域发展应用。在贝叶斯理论中,最常用的随机抽样方法就是马尔科夫链蒙特卡洛(MarkovChainMonteCarlo,简写为MCMC)方法。传统的MCMC方法当遇到多峰形态的或者十分尖锐或者十分平坦的后验概率密度函数时,很有可能发生马尔科夫链不能跑遍整个样本空间的情况,即出现不遍历(non-ergodic),样本很可能被困于“局部陷阱”,或者参数的维度很高时,往往估算结果不准确甚至失效。此外,传统MCMC方法无法估算出模型的评分,因此无法进行模型选择而找出较具可能性的模型,无法解决模型种类的不确定性的问题。而渐进马尔科夫链蒙特卡洛法(TransitionalMarkovChainMonteCarlo,简写为TMCMC)可以避免上面的问题,采样成功率更高,适用范围更 ...
【技术保护点】
1.一种向量化分布式并行的TMCMC随机抽样算法,其特征在于,包括如下步骤:S1,对需要通过TMCMC随机抽样算法计算的目标函数进行向量化,得到向量化的目标函数,即向量化的后验概率密度函数;S2,搭建基于MATLAB Distributed Computing Server工具箱的分布式计算平台;S3,在所述分布式计算平台上运行向量化分布式并行的TMCMC算法,进而求解目标函数。
【技术特征摘要】
1.一种向量化分布式并行的TMCMC随机抽样算法,其特征在于,包括如下步骤:S1,对需要通过TMCMC随机抽样算法计算的目标函数进行向量化,得到向量化的目标函数,即向量化的后验概率密度函数;S2,搭建基于MATLABDistributedComputingServer工具箱的分布式计算平台;S3,在所述分布式计算平台上运行向量化分布式并行的TMCMC算法,进而求解目标函数。2.根据权利要求1所述的一种向量化分布式并行的TMCMC随机抽样算法,其特征在于,所述步骤S2包括如下步骤:S21,将多台计算机通过网络相互连通形成一个集群,实现计算资源、通信资源、信息资源全面共享,每台计算机构成一个计算节点;S22,将MATLABDistributedComputingServer工具箱安装在客户端计算机中,用户通过工具箱中的配置管理器完成集群调度策略、调度程序类型、以及路径的设置;S23,通过工具箱中的作业管理器定义和建立任务、协调分发各任务,所述作业管理器将各任务的计算结果汇总返回给客户端计算机。3.根据权利要求2所述的一种向量化分布式并行的TMCMC随机抽样算法,其特征在于,所述步骤S3包括如下步骤:S31,根据贝叶斯理论,向量化的目标函数,即向量化的后验概率密度函数f(θi|Mi,D)表示如下:f(θi|Mi,D)∝f(θi|Mi)·f(D|Mi,θi)(1)其中,f(D|Mi,θi)表示θi的似然函数,f(θi|Mi)表示θi的先验概率密度函数,Mi表示系统模型,即表征生产生活中某一系统的抽象数学模型,下标i表示第i个模型类,i=1,2,…,∞,系统模型由模型参数描述,模型参数即为系统抽象出来的数学模型中的自变量,θi表示第i个模型类对应的模型参数,D表示实际系统或者模拟系统的监测数据,监测数据包括系统的输入和输出数据;S32,非正则化的中间概率密度函数fij(θi)表示如下:其中,mi表示总的阶段数,表示第i个模型类第j个阶段的中间概率密度函数与后验概率密度函数的比例因子,fi0(θi)=f(θi|Mi),S33,从先验概率密度函数f(θi|Mi)=fi0(θi)中抽取样本向量,表示样本集合,下标k表示第k个样本,N表示先验概率密度函数采样的样本总数;再采用分布式并行的手段并行计算样本集合中每个采样点的似然函数的函数值;配置管理器自主的分配样本集合中的每个采样点的似然函数的函数值的计算工作给每个计算节点,进行并行计算;S34,根据第j阶段似然函数的函数值集合的变异系数的选定值计算可能性权重向量中的每一阶段的数值其中表示第i个模型类第j个阶段的模型参数中第k个样本,每一阶段的数值表示为:且将每一个的计算任务分发给每个计算节点并行计算,其中表示第i个模型类第j个阶段的模型参数中第k个样本的权重;S35,接着按下式根据重采样程序重采样得到fij+1(θi):其中,w.p.表示以概率,概率越大则表示该样本具有相对更大的概率密度值而更为可能被接受进入下一阶段fij+1(θi);l表示依概率重采样得到的本阶段样本的样本序号,它可以是k=...
【专利技术属性】
技术研发人员:曹诗泽,颜王吉,任伟新,
申请(专利权)人:合肥工业大学,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。