一种麻将对手定口预测方法、装置、存储介质及设备制造方法及图纸

技术编号:32200101 阅读:23 留言:0更新日期:2022-02-08 16:06
本发明专利技术提供一种麻将对手定口预测方法、装置、存储介质及设备,所述方法包括:获取当前麻将对局的当前场面信息;采用预设编码方法对当前场面信息进行编码,得到当前场面信息对应的编码数据;将当前场面信息对应的编码数据输入预训练的定口预测模型当中,输出每个对手的当前定口概率。本发明专利技术通过采用特定编码方法对麻将对局的场面信息进行编码,继而使用深度学习中卷积网络的强大特征表征能力让模型自主的学习隐藏在麻将博弈信息背后的逻辑关系,无需做过多人为的麻将特征设计和特征提取,相比于“爆打”AI能够简化特征工程,降低模型开发周期和对研究者的专业知识要求。和对研究者的专业知识要求。和对研究者的专业知识要求。

【技术实现步骤摘要】
一种麻将对手定口预测方法、装置、存储介质及设备


[0001]本专利技术涉及人工智能
,特别涉及一种麻将对手定口预测方法、装置、存储介质及设备。

技术介绍

[0002]对手建模方法是机器博弈的另外一个重要研究热点,其核心思想是研究分析对手行为特征并进行分类,分析其个性化行为趋向和策略弱点。好的对手建模方法可以为博弈智能体提供更为准确的非完备信息处理结果和环境估值结果,已经成为衡量博弈智能体水平的关键因素之一。
[0003]关于麻将这种状态空间复杂且不可见信息巨大的博弈游戏,其主要研究机构有日本、中国台湾和微软亚洲研究院团队。例如,LongCat和VeryLongCat麻将智能体主要是结合一定的人类经验构建搜索树以及采用蒙特卡洛模拟建立对手模型。通过蒙特卡洛模拟敌方麻将手牌,从而做出避免点炮的决策。蒙特卡洛模拟是一个消耗计算资源的耗时操作,并且由于非完全信息博弈中存在未知信息造成组合数过多,无法在有限时间内完成搜索,而且对手手牌的精度也不能得到有效的保证。
[0004]在2006~2016年,Naoki Mizukami and Yoshimasa Tsuruoka团队基于日本麻将规则,成功开发了“爆打”AI对手建模,其观点是根据蒙特卡洛模拟和对手模型生成一个麻将玩家。其中关于预测对手定口(或称听牌)的主要观点是利用特征提取的方式,并且使用逻辑回归这类传统的机器学习算法进行对手是否听牌的预测,达到0.777的AUC预测准确度。
[0005]然而,虽然“爆打”AI达到了较高的预测准确度,然后由于其使用的是传统的逻辑回归算法并且特征工程繁多复杂,需要大量基于人类对于麻将规则的认知进行特征提取,需要研究者对麻将规则和打法了然于心。

技术实现思路

[0006]基于此,本专利技术的目的是提供一种麻将对手定口预测方法、装置、存储介质及设备,以解决现有定口预测需要大量基于人类对于麻将规则的认知进行特征提取的技术问题。
[0007]根据本专利技术实施例的一种麻将对手定口预测方法,用于预测除本家以外的其他对手的定口概率,所述方法包括:获取当前麻将对局的当前场面信息,所述当前场面信息为所述本家当前已知的牌面信息;采用预设编码方法对所述当前场面信息进行编码,得到所述当前场面信息对应的编码数据;将所述当前场面信息对应的编码数据输入预训练的定口预测模型当中,输出每个对手的当前定口概率;其中,所述定口预测模型通过对历史麻将对局的编码数据进行麻将规则的深度学
习训练得到,所述历史麻将对局的编码数据由历史麻将对局的场面信息按所述预设编码方法对应编码得到。
[0008]另外,根据本专利技术上述实施例的一种麻将对手定口预测方法,还可以具有如下附加的技术特征:进一步地,所述定口预测模型的训练过程包括:获取历史麻将对局的场面信息,并采用所述预设编码方法对所述历史麻将对局的场面信息进行编码,得到所述历史麻将对局的编码数据;将所述历史麻将对局的编码数据输入到预设的卷积神经网络当中进行麻将规则的深度学习训练;计算出所述卷积神经网络的当前损失函数,并根据所述当前损失函数调整所述卷积神经网络的网络参数,以对所述卷积神经网络进行迭代训练,直到所述卷积神经网络的损失函数收敛于预设目标值。
[0009]进一步地,所述卷积神经网络包括依次连接的卷积核、残差模块、两层全连接层和多个输出头,所述输出头的数量与对手数量对应;所述卷积核的核大小为3*1,滤波器高度为256。
[0010]进一步地,所述卷积神经网络的损失函数为:Loss=k1*loss
1 + k2*loss
2 + k
n
*loss
n
;n代表输出头的数量,n为整数且n≥2,k
n
代表第n个输出头的权重系数,loss
n
代表第n个输出头的交叉熵损失函数,其中:式中, y
i
表示样本i的标签、定口为1不定口为0,p
i
表示样本i预测为定口的概率,N为样本数量,1≤i≤N。
[0011]进一步地,所述场面信息包括牌集特征、顺序特征和整数特征,所述牌集特征包括本家手牌、每家副露和宝牌,所述顺序特征包括每家出牌及其出牌顺序,所述整数特征包括当前轮数、每家飞宝数和牌墙数。
[0012]进一步地,采用预设编码方法对所述当前场面信息进行编码的步骤包括:采用对应的预设编码方法分别对所述牌集特征、所述顺序特征和所述整数特征进行编码,得到所述牌集特征、所述顺序特征和所述整数特征对应的编码特征矩阵;将所述牌集特征、所述顺序特征和所述整数特征对应的编码特征矩阵按预设顺序进行垂直维度的拼接,得到298*34的二维特征矩阵;将298*34的二维特征矩阵转换为298*34*1的三维特征矩阵。
[0013]进一步地,所述采用对应的预设编码方法分别对所述牌集特征、所述顺序特征和所述整数特征进行编码的步骤包括:对于所述牌集特征,通过不同的字符来标识每种牌,每种字符下方对应有四个编码单元,每个编码单元的取值为0或1,通过四个编码单元的编码值来代表每种牌的数量;对于所述顺序特征,通过不同的字符来标识每种牌,每种字符下方对应有25个编码单元,25个编码单元分别对应25轮出牌,每个编码单元的取值为0或1,通过每个编码单元
的编码值来代表每轮出牌;对于所述整数特征,采用全0或全1编码方式进行编码,在表示特征时整行置为1或整行全置为0。
[0014]根据本专利技术实施例的一种麻将对手定口预测装置,用于预测除本家以外的其他对手的定口概率,所述装置包括:信息获取模块,用于获取当前麻将对局的当前场面信息,所述当前场面信息为所述本家当前已知的牌面信息;信息编码模块,用于采用预设编码方法对所述当前场面信息进行编码,得到所述当前场面信息对应的编码数据;定口预测模块,用于将所述当前场面信息对应的编码数据输入预训练的定口预测模型当中,输出每个对手的当前定口概率;其中,所述定口预测模型通过对历史麻将对局的编码数据进行麻将规则的深度学习训练得到,所述历史麻将对局的编码数据由历史麻将对局的场面信息按所述预设编码方法对应编码得到。
[0015]本专利技术还提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的麻将对手定口预测方法。
[0016]本专利技术还提出一种麻将对手定口预测设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述的麻将对手定口预测方法。
[0017]与现有技术相比:通过采用特定编码方法对麻将对局的场面信息进行编码,继而使用深度学习中卷积网络的强大特征表征能力让模型自主的学习隐藏在麻将博弈信息背后的逻辑关系(即麻将规则),由此训练得到了深度学习掌握了麻将规则的定口预测模型,后续根据当前麻将对局的当前场面信息按照相同编码方法编码得到的编码数据,即能够精确预测每个对手的当前定口概率。本方法当中的定口预测无需做过多人为的麻将特征设计和特征提取,相比于“爆打”AI能够简化特征工程,降低模型开发本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种麻将对手定口预测方法,其特征在于,应用于计算机设备中,用于预测除本家以外的其他对手的定口概率,所述方法包括:获取当前麻将对局的当前场面信息,所述当前场面信息为所述本家当前已知的牌面信息;采用预设编码方法对所述当前场面信息进行编码,得到所述当前场面信息对应的编码数据;将所述当前场面信息对应的编码数据输入预训练的定口预测模型当中,输出每个对手的当前定口概率;其中,所述定口预测模型通过对历史麻将对局的编码数据进行麻将规则的深度学习训练得到,所述历史麻将对局的编码数据由历史麻将对局的场面信息按所述预设编码方法对应编码得到。2.根据权利要求1所述的麻将对手定口预测方法,其特征在于,所述定口预测模型的训练过程包括:获取历史麻将对局的场面信息,并采用所述预设编码方法对所述历史麻将对局的场面信息进行编码,得到所述历史麻将对局的编码数据;将所述历史麻将对局的编码数据输入到预设的卷积神经网络当中进行麻将规则的深度学习训练;计算出所述卷积神经网络的当前损失函数,并根据所述当前损失函数调整所述卷积神经网络的网络参数,以对所述卷积神经网络进行迭代训练,直到所述卷积神经网络的损失函数收敛于预设目标值。3.根据权利要求2所述的麻将对手定口预测方法,其特征在于,所述卷积神经网络包括依次连接的卷积核、残差模块、两层全连接层和多个输出头,所述输出头的数量与对手数量对应;所述卷积核的核大小为3*1,滤波器高度为256。4.根据权利要求3所述的麻将对手定口预测方法,其特征在于,所述卷积神经网络的损失函数为:Loss=k1*loss
1 + k2*loss
2 + k
n
*loss
n
;n代表输出头的数量,n为整数且n≥2,k
n
代表第n个输出头的权重系数,loss
n
代表第n个输出头的交叉熵损失函数,其中:式中,y
i
表示样本i的标签、定口为1不定口为0,p
i
表示样本i预测为定口的概率,N为样本数量,1≤i≤N。5.根据权利要求1所述的麻将对手定口预测方法,其特征在于,所述场面信息包括牌集特征、顺序特征和整数特征,所述牌集特征包括本家手牌、每家副露和宝牌,所述顺序特征包括每家出牌及其出牌顺序...

【专利技术属性】
技术研发人员:王嘉旸王松李一华黄伟熊唤亮王命延
申请(专利权)人:江西中至科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1