棋类布局指导方法及装置制造方法及图纸

技术编号:25599303 阅读:37 留言:0更新日期:2020-09-11 23:57
本申请公开了一种棋类布局指导方法及装置。本申请的方法包括基于预设的二维正态分布的密度函数计算布局阶段每个落子点的估值;基于落子点的估值确定棋类布局指导策略。本申请解决了现有的布局策略准确性低,影响最终的战斗结果的问题技术问题。

【技术实现步骤摘要】
棋类布局指导方法及装置
本申请涉及计算机博弈
,具体而言,涉及一种棋类布局指导方法及装置。
技术介绍
久棋游戏过程分为两个顺序阶段:布局阶段和战斗阶段。在布局阶段,是首先占领以建造优势阵型;因此,布局的质量对最终战斗效果有重要影响。现有的久棋布局策略为基于贝叶斯网络的布局指导策略,具体如下:确定久棋棋型间的贝叶斯网络拓扑关系,得到阵型间的全因素贝叶斯模型,以此模型设计贝叶斯网络结构。整理久棋的棋谱数据作为训练样本。从棋谱文件中,研究棋型中的条件概率表(ConditionalProbabilityTables,CPT),为有向无环图(DirectedAcyclicGraph,DAG)提供学习参数。其中,训练样本方法确定为:根据久棋棋规,确定久棋贝叶斯网络,获取棋谱样本数据中棋型间的条件概率。专利技术人在应用上述布局策略的过程中,发现由于棋谱有限,在布局阶段并不能很好地反映久棋棋盘的价值分布情况,导致得到的布局指导策略的准确性较低,从而影响最终的战斗结果。
技术实现思路
本申请的主要目的在于提供一种棋类布局指导方法及装置,以解决布局策略准确性低,影响最终的战斗结果的问题。为了实现上述目的,根据本申请的第一方面,提供了一种棋类布局指导的方法。根据本申请的棋类布局指导的方法包括:基于预设的二维正态分布的密度函数计算布局阶段每个落子点的估值;基于落子点的估值确定棋类布局指导策略。可选的,所述基于预设的二维正态分布的密度函数计算布局阶段每个交叉点的估值包括:获取棋盘布局,并基于所述棋盘布局确定二维正态分布中的均值;基于棋类知识得到二维正态分布的相关系数;基于所述均值和所述相关系数确定预设的二维正态分布的密度函数;根据预设的二维正态分布的密度函数得到棋盘中的每个落子点的估值。可选的,所述基于所述棋盘布局确定二维正态分布中的均值包括:基于落子位置坐标得到计算所述均值。可选的,基于所述均值和所述相关系数确定预设的二维正态分布的密度函数包括:将所述均值和所述相关系数代入到下述公式中得到预设的二维正态分布的密度函数:其中,x,y为棋盘中给每个落子的位置坐标,μ1、μ2为所述均值,σ1、σ2、ρ为所述相关系数,f(x,y)为预设的二维正态分布的密度函数。可选的,所述根据预设的二维正态分布的密度函数得到棋盘中的每个落子点的估值,包括:获取每个落子的位置坐标;基于每个落子的位置坐标以及预设的二维正态分布的密度函数计算每个落子点的估值。可选的,所述棋盘布局为久棋棋盘布局。为了实现上述目的,根据本申请的第二方面,提供了一种棋类布局指导的装置。根据本申请的棋类布局指导的装置包括:计算单元,用于基于预设的二维正态分布的密度函数计算布局阶段每个落子点的估值;确定单元,用于基于落子点的估值确定棋类布局指导策略。可选的,所述计算单元包括:第一确定模块,用于获取棋盘布局,并基于所述棋盘布局确定二维正态分布中的均值;第二确定模块,用于基于棋类知识得到二维正态分布的相关系数;第三确定模块,用于基于所述均值和所述相关系数确定预设的二维正态分布的密度函数;计算模块,用于根据预设的二维正态分布的密度函数得到棋盘中的每个落子点的估值。可选的,所述第一确定模块,用于:基于落子位置坐标得到计算所述均值。可选的,第三确定模块,用于:将所述均值和所述相关系数代入到下述公式中得到预设的二维正态分布的密度函数:其中,x,y为棋盘中给每个落子的位置坐标,μ1、μ2为所述均值,σ1、σ2、ρ为所述相关系数,f(x,y)为预设的二维正态分布的密度函数。可选的,计算模块,用于:获取每个落子的位置坐标;基于每个落子的位置坐标以及预设的二维正态分布的密度函数计算每个落子点的估值。可选的,所述棋盘布局为久棋棋盘布局。为了实现上述目的,根据本申请的第三方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行上述第一方面中任意一项所述的棋类布局指导的方法。为了实现上述目的,根据本申请的第四方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器执行上述第一方面中任意一项所述的棋类布局指导的方法。在本申请实施例中,棋类布局指导的方法及装置中,首先,基于预设的二维正态分布的密度函数计算布局阶段每个落子点的估值;其次,基于落子点的估值确定棋类布局指导策略。可以看出,本申请中基于二维正态分布计算出每个落子点的估值,将其应用在久棋的布局阶段能够很好的反映出棋盘的价值分布,因此即使棋谱样本有限,也可以保证布局指导的准确性。附图说明构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是根据本申请实施例提供的一种棋类布局指导的方法流程图;图2是根据本申请实施例提供的另一种棋类布局指导的方法流程图;图3是根据本申请实施例提供的久棋棋盘中每个交叉点的估值;图4是根据本申请实施例提供的棋类布局指导方法效果分析图;图5是根据本申请实施例提供的一种棋类布局指导的装置的组成框图;图6是根据本申请实施例提供的另一种棋类布局指导的装置的组成框图。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。根据本申请实施例,提供了一种棋类布局指导的方法,如图1所示,该方法包括如下的步骤:首先需要说明的是,本实施例的方法适用本文档来自技高网
...

【技术保护点】
1.棋类布局指导方法,基于强化学习算法进行指导,其特征在于,包括:/n基于预设的二维正态分布的密度函数计算布局阶段每个落子点的估值;/n基于落子点的估值确定棋类布局指导策略。/n

【技术特征摘要】
1.棋类布局指导方法,基于强化学习算法进行指导,其特征在于,包括:
基于预设的二维正态分布的密度函数计算布局阶段每个落子点的估值;
基于落子点的估值确定棋类布局指导策略。


2.如权利要求1所述的棋类布局指导方法,其特征在于,所述基于预设的二维正态分布的密度函数计算布局阶段每个交叉点的估值包括:
获取棋盘布局,并基于所述棋盘布局确定二维正态分布中的均值;
基于棋类知识得到二维正态分布的相关系数;
基于所述均值和所述相关系数确定预设的二维正态分布的密度函数;
根据预设的二维正态分布的密度函数得到棋盘中的每个落子点的估值。


3.如权利要求2所述的分布式任务调度方法,其特征在于,所述基于所述棋盘布局确定二维正态分布中的均值包括:
基于落子位置坐标得到计算所述均值。


4.如权利要求2所述的棋类布局指导方法,其特征在于,基于所述均值和所述相关系数确定预设的二维正态分布的密度函数包括:
将所述均值和所述相关系数代入到下述公式中得到预设的二维正态分布的密度函数:



其中,x,y为棋盘中给每个落子的位置坐标,μ1、μ2为所述均值,σ1、σ2、ρ为所述相关系数,f(x,y)为预设的二维正态分布的密度函数。


5.如权利要求2所述的棋类布局指导方法,其特征在于,所述根据预设的二维正态分布的密度函数得到棋盘中的每个落子点的估值,包括:
获取每个落子的位置坐标...

【专利技术属性】
技术研发人员:李霞丽吴立成吕征宇
申请(专利权)人:中央民族大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1