一种机器博弈辅助决策优化方法及系统技术方案

技术编号:39496786 阅读:21 留言:0更新日期:2023-11-24 11:25
本发明专利技术属于机器博弈辅助决策优化技术领域,公开了一种机器博弈辅助决策优化方法及系统,所述机器博弈辅助决策优化系统包括:博弈数据采集模块

【技术实现步骤摘要】
一种机器博弈辅助决策优化方法及系统


[0001]本专利技术属于机器博弈辅助决策优化
,尤其涉及一种机器博弈辅助决策优化方法及系统


技术介绍

[0002]机器博弈是指构建和训练计算机系统,使之能够模仿人类的方式进行信息获取

信息分析

智能决策和自动学习,进而成为一个博弈智能体

机器博弈是计算机展现其智能水平的窗口,是检验人工智能发展水平的手段之一

机器博弈研究的很多问题与现实生活中的商业竞争

战争等情况十分相似,对此类问题的决策具有很好的参考价值

博弈贯穿人类文明的发展进程,早在封建社会早期就诞生了中国象棋等博弈游戏,战国时期的田忌赛马更是作为一个经典的博弈案例被世人所熟知

随着人类社会的发展,博弈越来越广泛地存在于人类活动中;然而,现有机器博弈辅助决策优化系统对博弈对局数据分析效率低;同时,博弈决策需要耗费大量的人力来编制精细的规则

[0003]通过上述分析,现有技术存本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种机器博弈辅助决策优化系统,其特征在于,所述机器博弈辅助决策优化系统包括:博弈数据采集模块

博弈局势判断模块

博弈数据分析模块

决策生成模块

决策优化模块

决策反馈模块;博弈数据采集模块,与博弈局势判断模块连接,用于采集博弈对局数据;博弈数据采集模块将获取到的数据进行编码和压缩处理,博弈数据采集模块将采集到的数据通过无线信号传递给博弈局势判断模块进行后续处理和分析;博弈局势判断模块,与博弈数据采集模块

博弈数据分析模块连接,用于对博弈对局局势进行判断;博弈局势判断模块接收到博弈数据采集模块的数据,解码和解压传输的数据,恢复为原始的博弈对局数据;并使用专家系统进行局势判断,利用专家知识和规则来评估博弈对局的局势;通过建立规则库和知识库,并基于当前的对局数据匹配规则和知识,推断当前局势的状态和趋势;博弈数据分析模块,与博弈局势判断模块

决策生成模块连接,用于对博弈对局数据进行分析;博弈数据分析模块接收博弈局势判断模块的局势分析数据,使用博弈数据分析方法进行博弈数据分析,并将得到的分析结果传输至决策生成模块;决策生成模块,与博弈数据分析模块

决策优化模块连接,用于根据博弈对局数据分析结构生成博弈对局决策;决策生成模块接收博弈数据分析模块提供的分析结果,根据这些信息来生成博弈对局决策,使用决策生成方法来评估可行的行动选项,并选择最优的决策;生成的决策将传递给决策优化模块;决策优化模块,与决策生成模块

决策反馈模块连接,用于对博弈对局决策进行优化;决策优化模块接收来自决策生成模块的博弈对局决策作为输入,实用粒子群优化算法对这些决策进行优化,优化后的决策结果将通过连接到决策反馈模块的通道传输;决策反馈模块,与决策优化模块连接,用于将优化的博弈对局决策进行反馈;决策反馈模块根据需要,将优化后的决策结果通过网络连接传输给相关的实体或系统
。2.
一种如权利要求1所述的机器博弈辅助决策优化方法,其特征在于,所述机器博弈辅助决策优化方法包括以下步骤:步骤一,通过博弈数据采集模块采集博弈对局数据;通过博弈局势判断模块对博弈对局局势进行判断;步骤二,通过博弈数据分析模块对博弈对局数据进行分析;通过决策生成模块根据博弈对局数据分析结构生成博弈对局决策;步骤三,通过决策优化模块对博弈对局决策进行优化;通过决策反馈模块将优化的博弈对局决策进行反馈
。3.
如权利要求1所述机器博弈辅助决策优化系统,其特征在于,所述博弈数据分析模块分析方法如下:
(1)
获取博弈对局数据,通过统计程序统计博弈对局数据;获取博弈对局收益数据
(Ud

1)
,其中,
d
为大于或等于1的整数;获取当前节点的博弈对局双方的动作和对局局势;根据当前节点的博弈对局双方的动作和对局局势确定当前节点博弈对局双方的当前动作收益
(B)

(2)
根据所述博弈对局收益数据
(Ud

1)
和所述当前动作收益
(B)
得到所述当前节点的
博弈对局收益数据
(Ud)。4.
如权利要求2所述机器博弈辅助决策优化系统,其特征在于,所述根据所述博弈对局收益数据
(Ud

1)
和所述当前动作收益
(B)
得到所述当前节点的博弈对局收益数据
(Ud)
包括:对所述博弈对局收益数据
(Ud

1)
和所述当前动作收益
(B)
求和得到所述当前节点的博弈对局收益数据
(Ud)。5.
如权利要求2所述机器博弈辅助决策优化系统,其特征在于,所述根据当前节点的博弈对局双方的动作和对局局势确定当前节点博弈对局双方的当前动作收益
(B)
包括:根据当前节点的博弈对局双方的动作和对局局势得到当前节点的影响因子,所述影响因子为根据样本数据学习得到的参数;根据所述当前节点的影响因子确定当前节点博弈对局双方的当前动作收益
(B)
;采用如下公式得到当前节点的影响因子:
Impact(a)

wCC(a)+wIC(a)+wAC(a)
,其...

【专利技术属性】
技术研发人员:张加佳刘园园漆舒汉吴宇琳王轩
申请(专利权)人:哈尔滨工业大学深圳哈尔滨工业大学深圳科技创新研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1