基于随机自动机的交互式多目标优化决策方法技术

技术编号:20364631 阅读:26 留言:0更新日期:2019-02-16 17:19
本发明专利技术公开了一种基于随机自动机的交互式多目标优化决策方法,包括步骤:分析目标函数间的关系,确定各目标函数值的变化范围;对目标集在已定的变化范围内进行多目标优化,得到帕累托解集,以此作为候选解集;结合决策者偏好,利用变结构随机自动机的学习行为,运用自动机博弈模型得到多目标解集的参考点;利用实现标量化函数结合现有的候选解集和参考点做出选择,得到此时最偏好的候选解;运用更新各目标函数上限值的方法,更新随机自动机的输出集,得到新的参考点,并使得目标集在更新后的变化范围内进行多目标优化,得到最终的方案。本发明专利技术有效融合决策者的偏好,并考虑各目标之间博弈的特性,具有显著的工程实用价值和广泛的应用前景。

【技术实现步骤摘要】
基于随机自动机的交互式多目标优化决策方法
本专利技术涉及多目标的优化决策
,具体涉及一种基于随机自动机的交互式多目标优化决策方法。
技术介绍
在很多实际问题中,例如工程设计、经济、管理、军事等领域,衡量一个方案的好坏往往难以用一个指标来判断,而需要用多个目标来比较,其实质是多目标优化问题。而这些目标有时不甚协调,甚至是矛盾的,因此不可能存在唯一的最优解使得这些目标同时达到最优。通过多个目标得到的是一个集合,该集合称为帕累托解集,且该解集中每个解之间不能相互支配。但是在实际应用环境中,只能实施唯一的方案,这就要求决策者从帕累托解集中挑选唯一的而且合适的解作为最终的方案。虽然前人在多目标优化方面已经积淀了大量的成果,但几乎都只是侧重于求解帕累托解集,而没有深入研究有效地结合决策者的偏好选择最终的方案这一重要问题。例如,大部分文献只是侧重于研究各类优化算法以求得质量更高的帕累托前沿,然后使用一种处理方式不够“细腻”的模糊决策方法来确定多目标优化决策的最终方案。这种方案完全没有考虑决策者的偏好,只是把它们机械化的平等对待,这并不适合实际问题的应用需求。于是,多属性决策分析方法引入了多目标权重及决策者评分来获取最终的优化方案,它相对于模糊决策方法来讲,更具实际意义和参考价值。然而,设置各目标权重和对一定量的候选解进行评分的这两个过程太过依赖决策者的主观评判且会花费大量的人工成本,并且决策者的偏好只能停留在决策层面,而无法对多目标的优化过程起到指导作用来加快优化进程。值得注意的是,决策者并非对全部的候选解都感兴趣,尤其对于更多(≥3)个目标的优化问题,出于帕累托解集中解的个数随着目标的个数呈指数增长的缘故,利用决策者的偏好来加快优化过程变得尤为必要。因此一些学者提出了决策者对各目标函数预设理想值作为参考点来指导多目标的优化过程,使得算法的搜索策略专注于决策者感兴趣的区域,并使用与参考点相关的实现标量化函数计算得到最终方案。但是,上述的基于参考点的优化决策方法中并没有考虑参考点的生成方式,且前人在仿真实验中假设的参考点也是随机给出且固定不变的,这脱离了实际的应用背景。代表着决策者偏好的参考点的生成与更新决定着优化进程中搜索区域的不断调整和决策过程中最终方案的实际价值。因此对于多目标优化决策来讲,为了得到切实可行的决策方案,必须充分考虑参考点在实际环境中的生成和更新的方式。
技术实现思路
本专利技术的目的是为了解决现有技术中的上述缺陷,提供一种基于随机自动机的交互式多目标优化决策方法,该方法不仅能有效融合决策者的偏好,更可以考虑各目标之间博弈的特性,适用于解决复杂多目标优化决策问题。本专利技术的目的可以通过采取如下技术方案达到:一种基于随机自动机的交互式多目标优化决策方法,所述的决策方法包括下列步骤:S1、分析目标函数间的关系,确定各目标函数值的变化范围;S2、对目标集在已定的变化范围内进行多目标优化,得到帕累托解集,以此作为候选解集;S3、结合决策者偏好,利用变结构随机自动机的学习行为,运用自动机博弈模型得到多目标解集的参考点;S4、利用实现标量化函数结合现有的候选解集和参考点做出选择,得到此时最偏好的候选解;S5、通过上一步骤得到的最偏好的候选解,运用更新各目标函数上限值的方法,来更新随机自动机的输出集,得到新的参考点,并使得目标集在更新后的变化范围内进行多目标优化,以满足结束条件,得到最终的方案。进一步地,所述的步骤S1中,对各目标函数在既定的约束条件下进行单目标优化,得到各目标函数值变化范围的下限,另通过专家设置保留值的方式来获取变化范围的上限。进一步地,所述的步骤S2中,对目标集在已定的变化范围内采用基于多目标群体搜索算法进行多目标优化。进一步地,所述的步骤S3过程如下:S301、确定变结构随机自动机A={X,Y,W,g,P(t),T}的六个组成部分。输入集X={0,1},0表示奖赏,1表示惩罚;输出集Y={y1,y2...,yr}(r≥2),将目标函数值的变化范围等间距离散化(各目标离散值的间距需相同),记为各目标对应的随机自动机的输出集,表示为Y={Y1,Y2,...,YM},M表示目标的个数,其中状态集W={w1,w2...,wr};输出函数yi=g(wi);状态概率向量其中pi(t)表示自动机在时刻t选择状态wi的概率。在初始状态(t=0),对每个目标函数对应的状态概率向量,设置各状态对应的概率相等且保证强化体系T,通过P(t+1)=T(P(t),X(t),W(t))由P(t)生成P(t+1),其数学描述如下:输入(决策者)为0(奖赏)时:pi(t+1)=pi(t)+β(1-pi(t)),0<β<1pj(t+1)=(1-β)pj(t),1≤j≤r,j≠i输入(决策者)为1(惩罚)时:pj(t+1)=pj(t),1≤j≤r其中β为影响自动机学习速率的参数。如果变结构随机自动机A在时刻t选择了状态wi并且环境输出了0(决策者给予了奖赏),那么状态概率pi(t)是增加的,而向量P(t)的其他组成部分是减少的。如果环境输出了1(决策者给予了惩罚),则P(t)不变。S302、构建变结构随机自动机博弈模型,得到多目标解集的参考点。进一步地,所述的步骤S4中选择出最偏好的候选解的过程如下:S401、利用实现标量化函数,结合现有的候选解集和参考点,计算得到此时最偏好的候选解,其数学描述如下:其中,q=(q1,q2,...,qM)表示参考点,若参考点q位于由Z=f(S)确定的可行域内,则该参考点是可行的,反之,该参考点不可行。w=(ω1,ω2,...,ωM)表示一些固定的正加权向量,参数ρ是增加系数且必须是一个小的正值。集合S表示决策变量集x的可行域。S402、将参考点和现有的候选解代入上式,计算各候选解对应的s(q,f(x),w)值,最终,对应s(q,f(x),w)最小值的候选解即被选为最偏好的候选解。进一步地,所述的步骤S5中通过上一步骤得到的最偏好的候选解,运用更新各目标函数上限值的方法的更新公式如下:其中,表示第j个目标函数在第i+1次搜索时变化范围的上限值,表示在i次搜索时,最偏好的候选解中第j个目标函数的值,表示第j个目标函数最大的上限值。αi是控制搜索空间收缩速率的参数,在[0,1]区间内取值,αi值越小,搜索空间的收缩速率越快。在更新了目标函数的上限值之后(下限值保持不变),各目标函数的变化范围发生改变。随机自动机的输出集随之发生更新,通过新一轮自动机博弈得到新的参考点。与此同时,目标集在更新后的变化范围内进行多目标优化,得到新的候选解集。通过判断是否满足结束条件,得到最终的方案。本专利技术相对于现有技术具有如下的优点及效果:1)本专利技术是一种科学而且易行的交互式优化决策方法,不仅能有效融合决策者的偏好,更能很好地考虑各目标之间博弈的特性,具有显著的工程实用价值,具备广泛的应用前景。2)本专利技术首先采用随机自动机博弈模型来生成符合决策者偏好的参考点,符合众多实际情况。3)本专利技术采用更新目标函数上限值的方法,不仅能有效加快多目标优化进程,更能帮助决策者在更少更感兴趣的选项中更新参考点,获得切实可行的最终方案。附图说明图1是本专利技术公开的基于随机自动机的交互式多目标优化决策方法的流程图;图2是本专利技术中自动机博弈本文档来自技高网
...

【技术保护点】
1.一种基于随机自动机的交互式多目标优化决策方法,其特征在于,所述的决策方法包括以下步骤:S1、分析目标函数间的关系,确定各目标函数值的变化范围;S2、对目标集在已定的变化范围内进行多目标优化,得到帕累托解集,以此作为候选解集;S3、结合决策者偏好,利用变结构随机自动机的学习行为,运用自动机博弈模型得到多目标解集的参考点;S4、利用实现标量化函数结合现有的候选解集和参考点做出选择,得到此时最偏好的候选解;S5、通过上一步骤得到的最偏好的候选解,运用更新各目标函数上限值的方法,来更新随机自动机的输出集,得到新的参考点,并使得目标集在更新后的变化范围内进行多目标优化,以满足结束条件,得到最终的交互式多目标优化决策方案。

【技术特征摘要】
1.一种基于随机自动机的交互式多目标优化决策方法,其特征在于,所述的决策方法包括以下步骤:S1、分析目标函数间的关系,确定各目标函数值的变化范围;S2、对目标集在已定的变化范围内进行多目标优化,得到帕累托解集,以此作为候选解集;S3、结合决策者偏好,利用变结构随机自动机的学习行为,运用自动机博弈模型得到多目标解集的参考点;S4、利用实现标量化函数结合现有的候选解集和参考点做出选择,得到此时最偏好的候选解;S5、通过上一步骤得到的最偏好的候选解,运用更新各目标函数上限值的方法,来更新随机自动机的输出集,得到新的参考点,并使得目标集在更新后的变化范围内进行多目标优化,以满足结束条件,得到最终的交互式多目标优化决策方案。2.根据权利要求1所述的基于随机自动机的交互式多目标优化决策方法,其特征在于,所述的步骤S1中,对各目标函数在既定的约束条件下进行单目标优化,得到各目标函数值变化范围的下限,另通过专家设置保留值的方式来获取目标函数值变化范围的上限。3.根据权利要求1所述的基于随机自动机的交互式多目标优化决策方法,其特征在于,所述的步骤S2中,对目标集在已定的变化范围内采用基于多目标群体搜索算法进行多目标优化。4.根据权利要求1所述的基于随机自动机的交互式多目标优化决策方法,其特征在于,所述的步骤S3过程如下:S301、确定变结构随机自动机A={X,Y,W,g,P(t),T}中六个组成部分,其中,输入集X={0,1},0表示奖赏,1表示惩罚;输出集Y={y1,y2...,yr},其中r≥2,将目标函数值的变化范围等间距离散化,各目标离散值的间距需相同,记为各目标对应的随机自动机的输出集,表示为Y={Y1,Y2,...,YM},M表示目标的个数,其中状态集W={w1,w2...,wr};输出函数yi=g(wi);状态概率向量P(t)=(p1(t),p2(t),...,pr(t)),其中,pi(t)表示自动机在时刻t选择状态wi的概率,在初始状态t=0,对每个目标函数对应的状态概率...

【专利技术属性】
技术研发人员:吴青华郑杰辉秦颖婕
申请(专利权)人:华南理工大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1