当前位置: 首页 > 专利查询>中国航空工业集团公司沈阳飞机设计研究所专利>正文

面向遗传模糊推理的随机策略转化方法技术

技术编号：20045976 阅读：48 留言：0更新日期：2019-01-09 04:30

本发明专利技术公开了一种面向遗传模糊推理的随机策略转化方法，包括：假设模糊推理树所代表的策略用π(s,θ)＝a表示，由于模糊推理树是由多个模糊推理系统组成，因此，将策略改写成π(s,FISi(θii))＝a；设定输出动作action为分布采样形态；利用第i个输出节点FISouti构建动作分布参数，形成动作生成分布；利用分布采样技术输出相应的动作。本发明专利技术能够解决GFT算法模型在零和博弈中不能保证收敛到纳什均衡的问题，通过将GFT由确定性策略转化为随机策略，使其经过充分的自博弈训练之后具备收敛到纳什均衡的能力。

全部详细技术资料下载

【技术实现步骤摘要】
面向遗传模糊推理的随机策略转化方法
本专利技术飞机
，具体涉及一种面向遗传模糊推理的随机策略转化方法。
技术介绍
GFT(geneticfuzzytree，遗传模糊树)作为一种实用性较强的智能决策算法，已被证明能在高保真的模拟空战任务中实现无人战斗机的飞行控制和战术决策，这说明训练成熟的GFT算法可用于某些策略性较强的场景下的智能决策。GFT算法使用模糊推理树作为策略，利用遗传算法来优化策略中的参数。然而本质上来讲模糊推理树属于确定性策略，也就是任何时刻给定策略相同的输入，输出的action一定是相同的。如果采用deterministicpolicy策略(确定性策略)，是对每个s都有一个确定性的a，即π(s)＝a，确定性策略在大量博弈试验中非常容易被利用。也就是说，如果对手摸清了在某一个策略输入情况下，我方肯定会执行某个action，那么对手就会营造一个这样的策略输入，并利用事先准备好的action来反制我方。也就是说确定性策略并不能保证通过优化得到一个能够战胜所有其他策略的策略，也就是得到纳什均衡点。因此，希望有一种技术方案来克服或至少减轻现有技术的至少一个上述问题。
技术实现思路
本专利技术的目的在于提供一种面向遗传模糊推理的随机策略转化方法来克服或至少减轻现有技术中的至少一个上述问题。为实现上述目的，本专利技术提供了一种面向遗传模糊推理的随机策略转化方法，包括：模糊推理树所代表的策略用π(s,θ)＝a表示，由于模糊推理树是由多个模糊推理系统组成，因此，将策略改写成π(s,FISi(θi))＝a，其中，θi为模糊推理树中第i个模糊推理系统所包含的参数...

【技术保护点】
1.一种面向遗传模糊推理的随机策略转化方法，其特征在于，包括模糊推理树所代表的策略用π(s,θ)＝a表示，将所述模糊推理树所代表的策略改写成π(s,FISi(θi))＝a；设定输出动作action为分布采样形态；利用第i个输出节点FISouti构建动作分布参数，形成动作生成分布；利用分布采样技术输出相应的动作；其中，s为模糊推理树的输入量全集，a为为模糊推理树经过随机策略转化最终输出的动作值，θi为模糊推理树中第i个模糊推理系统所包含的参数，FISi(θi)为模糊推理树第i个输出节点取值，π(s,FISi(θi))为以一定的概率阈值并且以FISi(θi)作为分布参数进行采样。

【技术特征摘要】
1.一种面向遗传模糊推理的随机策略转化方法，其特征在于，包括模糊推理树所代表的策略用π(s,θ)＝a表示，将所述模糊推理树所代表的策略改写成π(s,FISi(θi))＝a；设定输出动作action为分布采样形态；利用第i个输出节点FISouti构建动作分布参数，形成动作生成分布；利用分布采样技术输出相应的动作；其中，s为模糊推理树的输入量全集，a为为模糊推理树经过随机策略转化最终输出的动作值，θi为模糊推理树中第i个模糊推理系统所包含的参数，FISi(θi)为模糊推理树第i个输出节点取...

【专利技术属性】
技术研发人员：费思邈，管聪，杨芳，
申请(专利权)人：中国航空工业集团公司沈阳飞机设计研究所，
类型：发明
国别省市：辽宁,21

全部详细技术资料下载我是这个专利的主人