一种基于MCMC的优化信息检索方法技术

技术编号:5164554 阅读:257 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种基于MCMC的优化信息检索方法,包括以下步骤:一、设定初始并行链数目n,根据检索数据生成n条Markov链;设定总迭代次数s;二、根据对效率和结果准确率的要求,设定最小距离值;三、设定预迭代次数m,对步骤一中的n条Markov链进行分段预迭代,得到每两条链之间的距离值。四、进行判断,判断任意两条链之间的距离值是否小于或者等于所设定的最小距离值;五、假如结果是,就将进行比较的这两条链合并看作一条链;六、判断迭代次数是否小于s,如果是则继续进行迭代,并在迭代完成时回到步骤四;否则停止迭代,通过该迭代后的Markov链可以决定遍历检索数据的路径。本发明专利技术在兼顾全局搜索准确率的同时保证一定的搜索效率,减轻硬件的负担。

【技术实现步骤摘要】

本专利技术涉及一种新的优化的信息检索方法,特别涉及一种基于MCMC进行优化的 信息检索方法,属于信息检索领域。
技术介绍
马尔可夫链蒙特卡罗(MCMC)方法的提出是随着蒙特卡罗技术的出现,直到20世 纪90年代早期,MCMC在贝叶斯统计中的应用才被大众开始慢慢认识。经过最近20年的发 展,MCMC方法的应用业已涉及了统计推断应用的方方面面,例如生物统计领域、统计物理 领域、控制理论、通信技术、信息科学领域。MCMC包含了两个基本内容蒙特卡罗积分和马尔可夫链。MCMC是利用Markov链 的机制探索状态空间以生成样本的方法,这种机制能够保证Markov链将更多的时间放在 最重要的区域,从而使它产生的样本能够模仿目标分布的样本。由于MCMC方法的以上特点,使得该方法在信息检索领域被大量采用。在信息检索 领域,通常使用该方法对检索结果进行全局的抽样处理,得到精简的结果集,提高检索的效 率;或者通过在仿真实验中使用该方法来对检索数据进行预测,将预测结果用于实际检索 数据,缩小检索的范围。在现有的使用MCMC模拟方法进行信息检索的过程中,大多数的研究往往局限于 对某一个问题的把握,例如对全局本文档来自技高网...

【技术保护点】
一种基于MCMC的优化信息检索方法,其特征在于,包括以下步骤:一、设定初始并行链数目n,根据检索数据生成n条Markov链;设定总迭代次数s;二、根据对效率和结果准确率的要求,设定最小距离值;三、设定预迭代时分段的迭代次数m,对步骤一中的n条Markov链进行分段预迭代,得到每两条链之间的距离值,即每两条Markov链各段之间的欧式距离的平均值。四、进行判断,判断任意两条链之间的距离值是否小于或者等于所设定的最小距离值;五、假如结果是,就将进行比较的这两条链合并看作一条链,新链上每一点的值为原两条链的平均值,则n=n-1;六、判断迭代次数是否小于s,如果是则继续进行迭代,并在迭代完成时回到步骤...

【技术特征摘要】
一种基于MCMC的优化信息检索方法,其特征在于,包括以下步骤一、设定初始并行链数目n,根据检索数据生成n条Markov链;设定总迭代次数s;二、根据对效率和结果准确率的要求,设定最小距离值;三、设定预迭代时分段的迭代次数m,对步骤一中的n条Markov链进行分段预迭代,得到每两条链之间的距离值,即每两条Markov链各段之间的欧式距离的平均值。四、进行判断,判断任意两条链之间的距离值是否小于或者等于所设定的最小距离值;五、假如结果是,就将进行比较的这两条链合并看作一条链,新...

【专利技术属性】
技术研发人员:王维强牛振东赵育民
申请(专利权)人:北京理工大学
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1