【技术实现步骤摘要】
基于多目标粒子群优化的鲁棒性排序学习方法及其应用
本专利技术涉及信息检索与机器学习领域,尤其是涉及一种基于多目标粒子群优化的鲁棒性排序学习方法及其应用。
技术介绍
排序学习是利用机器学习技术去自动训练出排序模型以解决排序问题。它是信息检索与机器学习领域中研究的热点问题,在信息检索、搜索引擎、推荐系统和问答系统等方面有着广泛的应用前景。由于Web的动态性和用户信息需求的多样性,在不同的排序模型下,一些Web搜索的查询的性能也许会发生较大的变化,并且可能遭受显著性损失,从而降低用户的体验。一个鲁棒的检索系统应确保用户体验不因性能表现差的查询出现而受到损害。因此,为了尽可能地提高整体用户的体验,除了传统的相关性和重要性准则外,如何保证排序模型的鲁棒性,即相对于简单基准,尽管整体上获得了一个平均增益,但新的排序模型通常会在许多查询的性能上受到损失,是近年来排序学习研究面临的一个重要问题。因此,开发鲁棒性排序学习方法以训练鲁棒性感知的排序模型从而尽可能地改进所有用户的整体满意度是非常有必要。当前,排序学习研究者们主要是通过设计高级的排序特征和/或通过开发先进的排序学习方法,比较和评估多个排序模型,基于一些有效性度量标准,例如归一化折扣累积增益(NormalizedDiscountedCumulativeGain,NDCG)和期望倒数排序(Expectedreciprocalrank,ERR)等,选择一个最佳有效性的排序模型,其目标是聚焦于改进排序模型的平均有效性,这些方法往往忽视了排序模型的鲁棒性。鲁棒性差的排序模型会导致排序系统的不稳定,即一些查询的性能表现很好, ...
【技术保护点】
1.一种基于多目标粒子群优化的鲁棒性排序学习方法,其特征在于,包括以下步骤:步骤一,基于偏差‑方差均衡理论,设计排序模型的有效性偏差函数和鲁棒性方差函数,构建排序学习的两个优化性能指标;步骤二,在排序学习数据集上,基于多目标粒子群优化算法框架,迭代优化排序模型的有效性偏差函数和鲁棒性方差函数这两个目标以训练排序模型,从而产生排序模型归档解集;步骤三,基于多属性决策理论中的偏好顺序结构评估法PROMETHEE II的思想,从上一步骤所产生的排序模型归档解集中选择一个具有最大“净流”排序值的Pareto最优的排序模型以此作为训练出的最终排序模型。
【技术特征摘要】
1.一种基于多目标粒子群优化的鲁棒性排序学习方法,其特征在于,包括以下步骤:步骤一,基于偏差-方差均衡理论,设计排序模型的有效性偏差函数和鲁棒性方差函数,构建排序学习的两个优化性能指标;步骤二,在排序学习数据集上,基于多目标粒子群优化算法框架,迭代优化排序模型的有效性偏差函数和鲁棒性方差函数这两个目标以训练排序模型,从而产生排序模型归档解集;步骤三,基于多属性决策理论中的偏好顺序结构评估法PROMETHEEII的思想,从上一步骤所产生的排序模型归档解集中选择一个具有最大“净流”排序值的Pareto最优的排序模型以此作为训练出的最终排序模型。2.根据权利要求1所述的一种基于多目标粒子群优化的鲁棒性排序学习方法,其特征在于,所述的设计排序模型的有效性偏差函数和鲁棒性方差函数,构建排序学习的两个优化性能指标具体为:查询和查询集在排序模型下的有效性偏差函数和鲁棒性方差函数分别定义如下:定义1.查询qi的有效性偏差函数BiasR(qi)定义为:其中,表示查询qi下的所有文档Di在理想排序模型I,即所有文档全部正确排序下所获得的最佳有效性,表示查询qi下的所有文档Di在排序模型R下所获得的实际有效性,BiasR(qi)表示查询qi在排序模型R下的实际有效性相对于理想排序模型I的最佳有效性的偏差;定义2.查询集Q的有效性偏差函数BiasR(Q)定义为:其中,BiasR(Q)表示在排序模型R下查询集Q中所有查询qi的有效性偏差的平均值,|Q|表示查询集Q中查询qi的总个数;定义3.查询qi的鲁棒性方差函数VarianceR(qi)定义为:VarianceR(qi)=[BiasR(qi)-BiasR(Q)]2…(3)其中,VarianceR(qi)表示在排序模型R下查询qi的有效性偏差BiasR(qi)离查询集Q的有效性偏差BiasR(Q)的离散程度;定义4.查询集Q的鲁棒性方差函数VarianceR(Q)定义为:其中,VarianceR(Q)表示在排序模型R下查询集Q中所有查询qi的鲁棒性方差的平均值;将鲁棒性排序学习问题转化为一个同时考虑有效性和鲁棒性的多目标优化问题,依据上述有效性偏差函数和鲁棒性方差函数的定义,则鲁棒性排序学习问题可形式化描述为:Utility(Q)={minBiasR(Q),minVarianceR(Q)}…(5)即在排序学习的过程中,同时最小化有效性偏差函数BiasR(Q)和鲁棒性方差函数VarianceR(Q)以训练排序模型,为此,基于上述所构建的排序模型的优化性能指标BiasR(Q)和VarianceR(Q),可采用多目标智能优化算法,如多目标粒子群优化算法,同时最小化BiasR(Q)和VarianceR(Q)的值以达到均衡优化排序模型的有效性和鲁棒性的目的。3.根据权利要求2所述的一种基于多目标粒子群优化的鲁棒性排序学习方法,其特征在于,所述的基于多目标粒子群优化算法框架,迭代优化排序模型的有效性偏差函数和鲁棒性方差函数这两个目标以训练排序模型,从而产生排序模型归档解集具体为:步骤1.初始化粒子群的相关参数;步骤2.基于所给定的排序学习数据集,在理想排序模型I下,计算每个查询qi的最佳有效性步骤3.对每个粒子的相关信息进行初始化以产生初始排序模型集合P;步骤4.初始化迭代计数器t=0;步骤5.创建初始排序模型归档解集Archive,在初始排序模型P中,选择非支配排序模型,存储于排序模型归档解集Archive中;步骤6.计算排序模型归档解集Archive中每个非支配解的拥挤距离;步骤7.按拥挤距离大小将Archive中的非支配解降序排列;步骤8.对每个粒子执行操作以更新粒子的位置和速度信息;步骤9.更新排序模型归档解集Archive;步骤10.更新粒子群P中每个粒子的个体极值Pbest[i];步骤11.t=t+1,若t<MAXT,则转步骤6,否则,输出排序模型归档解集Archive中的各排序模型,即产生最终排序模型集合。4.根据权利要求3所述的一种基于多目标粒子群优化的鲁棒性排序学习方法,其特征在于,所述的步骤1的相关参数包括种群规模Pop、加速因子c1和c2、初始惯性权重ω0、最终惯性权重ω1、最大迭代次数MAXT、目标函数个数N和变异概率Mu。5.根据权利要求3所述的一种基于多目标粒子群优化的鲁棒性排序学习方法,其特征在于,所述的步骤3的对每个粒子的相关信息进行初始化以产生初始排序模型集合P具体为:31)随机初始化各粒子的位置P[i];采用实数编码,在排序学习问题的可行排序模型域内,随机产生每个粒子的初始位置P[i],即各排序特征所对应的权值,其中1≤i≤Pop;32)初始化各粒子的速度V[i]=0;33)计算排序模型的有效性偏差函数和鲁棒性方差函数值;按照各粒子的位置P[i]和线性排序评分函数计算各查询qi下的每个文档dij的评分,其中fijm(qi,dij)表示查询—文档对(qi,dij)的第M维排序特征,依据不同的Score(qi,dij)值从大到小对各查询qi下各文档dij进行top-n快速排序,再依据文档的排序位置及其相关性标注Yi,联合理想排序模型I,按照公式(1)至公式(4)分别计算查询qi和查询集Q的有效性偏差函数BiasR(qi)和BiasR(Q)以及鲁棒性方差函数VarianceR(qi)和VarianceR(Q)的各个值,以获得排序模型的有效性偏差函数和鲁棒性方差函数的目标值;34)初始化粒子的个体极值Pbest[i]=P[i];35)根据各个粒子的Pbest[i]确定初始种群的全局极值Gbest。6.根据权利要求3所述的一种基于多目标粒子群优化的鲁棒性排序学习方法,其特征在于,所述的步骤8对每个粒...
【专利技术属性】
技术研发人员:李金忠,夏洁武,曾劲涛,彭蕾,
申请(专利权)人:井冈山大学,
类型:发明
国别省市:江西,36
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。