一种基于ＭＣＭＣ的优化信息检索方法技术

技术编号：5164554 阅读：240 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及一种基于ＭＣＭＣ的优化信息检索方法，包括以下步骤：一、设定初始并行链数目ｎ，根据检索数据生成ｎ条Ｍａｒｋｏｖ链；设定总迭代次数ｓ；二、根据对效率和结果准确率的要求，设定最小距离值；三、设定预迭代次数ｍ，对步骤一中的ｎ条Ｍａｒｋｏｖ链进行分段预迭代，得到每两条链之间的距离值。四、进行判断，判断任意两条链之间的距离值是否小于或者等于所设定的最小距离值；五、假如结果是，就将进行比较的这两条链合并看作一条链；六、判断迭代次数是否小于ｓ，如果是则继续进行迭代，并在迭代完成时回到步骤四；否则停止迭代，通过该迭代后的Ｍａｒｋｏｖ链可以决定遍历检索数据的路径。本发明专利技术在兼顾全局搜索准确率的同时保证一定的搜索效率，减轻硬件的负担。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种新的优化的信息检索方法，特别涉及一种基于MCMC进行优化的信息检索方法，属于信息检索领域。
技术介绍
马尔可夫链蒙特卡罗(MCMC)方法的提出是随着蒙特卡罗技术的出现，直到20世纪90年代早期，MCMC在贝叶斯统计中的应用才被大众开始慢慢认识。经过最近20年的发展，MCMC方法的应用业已涉及了统计推断应用的方方面面，例如生物统计领域、统计物理领域、控制理论、通信技术、信息科学领域。MCMC包含了两个基本内容蒙特卡罗积分和马尔可夫链。MCMC是利用Markov链的机制探索状态空间以生成样本的方法，这种机制能够保证Markov链将更多的时间放在最重要的区域，从而使它产生的样本能够模仿目标分布的样本。由于MCMC方法的以上特点，使得该方法在信息检索领域被大量采用。在信息检索领域，通常使用该方法对检索结果进行全局的抽样处理，得到精简的结果集，提高检索的效率；或者通过在仿真实验中使用该方法来对检索数据进行预测，将预测结果用于实际检索数据，缩小检索的范围。在现有的使用MCMC模拟方法进行信息检索的过程中，大多数的研究往往局限于对某一个问题的把握，例如对全局搜索结果的把握，而忽略了搜索的效率，或者仅仅针对如何提高搜索的效率，而没有保证最终的搜索结果的准确度。因此，如何同时兼顾对全局搜索准确率的把握，并且又能够保持一定的搜索效率，减轻硬件的负担成为一个非常有意义的工作。在实际过程中，可能会拥有多条Morkov链，计算的难度会比较大，而且容易陷入不能得到最优解的过程。
技术实现思路
本专利技术的目的是针对现有技术的不足，提高搜索的...

【技术保护点】
一种基于ＭＣＭＣ的优化信息检索方法，其特征在于，包括以下步骤：一、设定初始并行链数目ｎ，根据检索数据生成ｎ条Ｍａｒｋｏｖ链；设定总迭代次数ｓ；二、根据对效率和结果准确率的要求，设定最小距离值；三、设定预迭代时分段的迭代次数ｍ，对步骤一中的ｎ条Ｍａｒｋｏｖ链进行分段预迭代，得到每两条链之间的距离值，即每两条Ｍａｒｋｏｖ链各段之间的欧式距离的平均值。四、进行判断，判断任意两条链之间的距离值是否小于或者等于所设定的最小距离值；五、假如结果是，就将进行比较的这两条链合并看作一条链，新链上每一点的值为原两条链的平均值，则ｎ＝ｎ－１；六、判断迭代次数是否小于ｓ，如果是则继续进行迭代，并在迭代完成时回到步骤四；否则停止迭代，得到最终的结果，即迭代后的Ｍａｒｋｏｖ链，通过该迭代后的Ｍａｒｋｏｖ链可以决定遍历检索数据的路径。

【技术特征摘要】
一种基于MCMC的优化信息检索方法，其特征在于，包括以下步骤一、设定初始并行链数目n，根据检索数据生成n条Markov链；设定总迭代次数s；二、根据对效率和结果准确率的要求，设定最小距离值；三、设定预迭代时分段的迭代次数m，对步骤一中的n条Markov链进行分段预迭代，得到每两条链之间的距离值，即每两条Markov链各段之间的欧式距离的平均值。四、进行判断，判断任意两条链之间的距离值是否小于或者等于所设定的最小距离值；五、假如结果是，就将进行比较的这两条链合并看作一条链，新...

【专利技术属性】
技术研发人员：王维强，牛振东，赵育民，
申请(专利权)人：北京理工大学，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人