对大样本空间复杂概率分布的无自相关采样方法技术

技术编号：21548052 阅读：120 留言：0更新日期：2019-07-06 21:32

本发明专利技术公布了一种对大样本空间复杂概率分布的无自相关采样方法，目的是解决MCMC方法的自相关问题以及跳步采样的效率损失问题。技术方案是：在产生样本时，通过设置样本缓冲区，消除样本之间的关联；或者作为后处理方法，按顺序读取已产生的样本，通过样本缓冲区更新样本序列，以消除样本序列自相关。每次产生一个样本，或者从文件中读取到一个样本时，将得到的样本存储到样本缓冲区中，并在缓冲区充满时从缓冲区中随机选择样本进行输出。通过这种随机输出的方式在样本之间增加了一层额外的随机性，最终达到消除样本序列自相关的目的。采用本发明专利技术计算速度快，维持了MCMC效率，额外增加的缓冲区操作的开销相对可忽略，同时消除了样本自相关。

A Non-autocorrelation Sampling Method for Complex Probability Distribution in Large Sample Space

全部详细技术资料下载

【技术实现步骤摘要】
对大样本空间复杂概率分布的无自相关采样方法
本专利技术涉及对大样本空间复杂概率分布样本的采样方法，尤指基于马尔科夫链的无自相关采样方法。
技术介绍
计算机对随机事件的处理是工程应用分析的必要手段。近几十年来，随着计算机性能的飞速发展，计算机已广泛应用于航空航天、汽车船舶设计制造、桥梁建筑设计制造、环境工程、气象预报、高分子材料等方面，而在这些工程应用中，均需要通过计算机对随机事件进行计算分析，以达到如桥梁可靠性检测、气象预报等目的。在随机事件分析中，一个必要步骤是对复杂概率分布进行采样，以获取独立、随机的样本。高效的采样算法是提高采样效率的必要手段。一般而言，工程应用中涉及到的随机事件来源复杂，数据量大，样本概率计算难度大，样本种类数可能多达1020量级以上。此类随机事件的分析需要大量的计算资源。除了尽可能提高硬件性能以满足计算资源的需求外，对采样方法的优化必不可少。大样本空间复杂概率分布采样问题可定义如下：·样本空间X＝{x1,x2,…,xi,…,xN}表示可能存在的N个样本(1≤i≤N)。N的值十分巨大，可能高达1020量级。·复杂概率分布由与领域相关的复杂概率分布函数f(x)描述，即采样得到样本xi的概率为f(xi)。概率值f(xi)的计算是困难的(一般为指数时间复杂度)，需要大量的计算资源。·构造样本序列t1,t2,…,tj,….,tM，其中对于任意的j(1≤j≤M，M的值随应用的不同而不同，1≤M≤N)均有样本tj∈X，并使得序列中的样本服从概率分布函数f描述的概率分布。概率分布函数f的计算一般需要大量的计算资源，是采样过程的关键点和难点。目前常...

【技术保护点】
1.一种对大样本空间复杂概率分布的无自相关采样方法，其特征在于包括以下步骤：第一步：选取初态，初始化缓冲区，方法是：1.1定义马尔科夫链的状态空间为S＝{s1,s2,…,si,…,sN}，其中对于正整数i，1≤i≤N，有si与样本空间中X＝{x1,x2,…,xi,…,xN}的元素xi对应；1.2构造基于马尔科夫链状态空间S上的样本概率函数fs(s)，使得对于整数i，均有fs(si)＝f(xi)，其中f(xi)是复杂概率分布函数，表示采样得到样本xi的概率；1.3任意选取状态空间S上的易采样随机分布g(s)作为辅助概率分布，其中g(si)表示采样得到状态si作为样本的概率；1.4设置样本缓冲区容量L初始值，L为正整数，初始化样本缓冲区为空，容量为可容纳L个样本，其中每个可存储样本的位置称为一个缓冲槽，初始化当前存储位置变量p＝1；1.5按均匀随机分布产生正整数o∈[1,N]，并以so作为马尔科夫链的初态，计算状态so对应的样本概率po＝fs(so)，并输出状态so的对应样本xo；1.6设置马尔科夫链当前状态sc＝so；1.7根据用户需求与应用特点，设置采样样本数量目标值Ns；第二步：产生...

【技术特征摘要】
1.一种对大样本空间复杂概率分布的无自相关采样方法，其特征在于包括以下步骤：第一步：选取初态，初始化缓冲区，方法是：1.1定义马尔科夫链的状态空间为S＝{s1,s2,…,si,…,sN}，其中对于正整数i，1≤i≤N，有si与样本空间中X＝{x1,x2,…,xi,…,xN}的元素xi对应；1.2构造基于马尔科夫链状态空间S上的样本概率函数fs(s)，使得对于整数i，均有fs(si)＝f(xi)，其中f(xi)是复杂概率分布函数，表示采样得到样本xi的概率；1.3任意选取状态空间S上的易采样随机分布g(s)作为辅助概率分布，其中g(si)表示采样得到状态si作为样本的概率；1.4设置样本缓冲区容量L初始值，L为正整数，初始化样本缓冲区为空，容量为可容纳L个样本，其中每个可存储样本的位置称为一个缓冲槽，初始化当前存储位置变量p＝1；1.5按均匀随机分布产生正整数o∈[1,N]，并以so作为马尔科夫链的初态，计算状态so对应的样本概率po＝fs(so)，并输出状态so的对应样本xo；1.6设置马尔科夫链当前状态sc＝so；1.7根据用户需求与应用特点，设置采样样本数量目标值Ns；第二步：产生待选状态，方法是：2.1从g(s)中随机采样得到状态sn作为待选状态，1≤n≤N；2.2计算待选状态对应的概率值fs(sn)；第三步：决策确定后续状态，生成样本，方法是：3.1计算接受概率paccept＝min(1,(fs(sn)g(sc))/(fs(sc)g(sn)))；3.2产生[0,1]区间内的随机数u；3.3若u<paccept，则令sc＝sn；否则sc保持不变；3.4生成状态sc对应的样本，并记录该样本产生的序号ngenerate；第四步：判定使用方式，方法是：若对样本实时性要求高，且无充分时间进行调试，设置模式变量mode＝1，并转第八步；若所进行的是调试过程，即测量所需缓冲区容量大小，则设置模式变量mode＝2，转第五步；第五步：存储样本：将第3.4步产生的样本存储到样本文件中；第六步：判断采样是否完成：若第3.4步得到的样本产生的序号ngenerate＝Ns，转第七步；若第3.4步得到的样本产生序号ngenerate<Ns，则转第二步；第七步：读取样...

【专利技术属性】
技术研发人员：吴俊杰，刘雍，熊敏，徐平，强晓刚，黄安琪，付祥，邓明堂，
申请(专利权)人：中国人民解放军国防科技大学，
类型：发明
国别省市：湖南,43

全部详细技术资料下载我是这个专利的主人