当前位置: 首页 > 专利查询>扬州大学专利>正文

一种基于异质性声誉回报的公共品博弈建模与仿真方法技术

技术编号:35007063 阅读:16 留言:0更新日期:2022-09-21 14:58
本发明专利技术公开了一种基于异质性声誉回报的公共品博弈建模与仿真方法,步骤如下:构建多人公共品博弈模型;依据建模后的公共品博弈规则,以主观博弈的学习理论更新个体策略;通过将个体声誉与博弈收益相联系,构建基于异质性回报的声誉监督机制;通过多轮次的重复博弈和主观学习,构建个体主观认知矩阵。本发明专利技术针对解决多人公共品博弈领域中合作困境的问题上结合了主观博弈理论、间接互惠机制,并且通过仿真实验证实了本发明专利技术所设计的基于异质性回报的声誉监督机制改善了主观博弈学习情境下个体主观认知的形成,促进了博弈系统合作水平的提升,有助于解决群体合作问题中的搭便车行为,为现实社会中激励机制的设计提供了相应的借鉴意义。借鉴意义。借鉴意义。

【技术实现步骤摘要】
一种基于异质性声誉回报的公共品博弈建模与仿真方法


[0001]本专利技术涉及复杂系统建模与仿真,特别是一种基于异质性声誉回报的公共品博弈建模与仿真方法。

技术介绍

[0002]社会困境问题在多人及多组织的行为活动中普遍存在,如碳排放问题、供应链管理问题等。社会困境描述了个体的最优行为与集体最优行为的不一致,如何化解社会困境是整个社会科学关注的焦点。
[0003]鉴于经典博弈论中完全理性假设的局限性,演化博弈论孕育而生,但在研究制度的演化问题时,演化博弈论无法解释制度演化的内在关联。主观博弈论将内生增长理论纳入了博弈分析框架中,有助于理解参与者认知在制度生成和变迁过程中的影响和作用。
[0004]目前,关于公共品博弈模型的大部分工作是基于同质收益结构的假设,这与现实中大部分情况不符。已经有一些研究试图探讨异质性收益对合作的影响,
[0005]再者,声誉机制作为间接互惠的一种,已被广泛运用于群体演化的分析研究中,在公共品博弈的背景下,已经有诸多研究通过仿真或实证的方法充分证明了声誉机制对合作的促进作用,但大多数关于声誉机制的研究都是从博弈的外生变化来解释博弈均衡的转化问题,很少有研究从内生的角度对博弈规则的演化及激励机制的设计进行探讨。

技术实现思路

[0006]专利技术目的:本专利技术的目的是提供一种基于异质性声誉回报的公共品博弈建模与仿真方法,从而为群体合作行为演化的研究提供了新的视角——基于主观博弈的视角,并对帮助解决群体合作困境问题具有一定的实际意义。
[0007]技术方案:本专利技术所述的一种基于异质性声誉回报的公共品博弈建模与仿真方法,包括以下步骤:
[0008](1)构建多人公共品博弈模型;
[0009]个体在初始化时被随机分配在二维网格的任意位置;博弈开始时,个体在方格子网络上随机游走,依据moore型规则挑选出n

1个邻居组成一个博弈小组G
l
;个体只参加一个群组的公共品博弈,并且在博弈过程中只能采取相同的策略s——合作C或背叛D。
[0010](2)多人主观博弈下主体策略的更新;
[0011](2.1)将公共品博弈局势建模为一种固定的规则,根据每一轮博弈后,组内采取合作C和背叛D的人数以及自身的策略,将博弈规则划分为2*n种局势,每一种局势都对应一个收益值π
i
;个体能够从每一轮的收益得知当前的策略分布情况,如表1和表2所示。
[0012]表1个体选择合作策略时的博弈局势
[0013][0014]表2个体选择背叛策略时的博弈局势
[0015][0016](2.2)个体被赋予短期记忆m,即它能够记住最近m轮博弈中所选策略s对应的收益情况;个体根据当前的博弈局势以及自身的主观认知对所采取的策略s产生相应的刺激R,刺激R经过演化产生对策略s的吸引力A,依据改进的Logistic转换方程计算下一轮策略s被选择的概率,如图1所示,代表个体i在t时刻选择策略s时所获得的收益,表示t时刻个体i关于策略s的刺激,表示t时刻个体i关于策略s的吸引力,吸引力由个体过去关于策略选择的主观认知所形成。
[0017]为了避免因协同因子过大而在策略更新时出现极化的现象,本专利技术对Logistic方程进行了相应的改进,改进后的转换方程如下所示:
[0018][0019]其中,表示t时刻个体i选择策略s的概率,参数λ
i
反映了个体i对刺激的敏感程度。
[0020](3)构建基于异质性回报的声誉监督机制;
[0021](3.1)系统中的个体在博弈开始时被定义一个相同的初始声誉值;在每一轮博弈结束后,系统中所有个体的收益受到异质性回报系数θ的影响;相应地,每一轮博弈结束后个体的收益为:
[0022][0023][0024]其中,θ由个体声誉R
x
与系统的平均声誉决定,具体形式为:
[0025][0026]其中,α为异质性回报调节系数,取值范围是[0,1],R
max
为系统内个体的声誉最大差值,取值为100;
[0027](3.2)每一轮博弈结束后,各博弈群组从组内随机抽取2个个体进行配对;对于被
抽取的个体j1和j2,根据其本轮采取的策略来更新声誉,更新规则如表3所示。
[0028]表3个体声誉的更新机制
[0029][0030](4)构建主观认知矩阵;
[0031]个体主观认知矩阵的形成受到过往经历以及正在经历的博弈局势的影响,定义k为短期记忆阈值,个体需要经历k次相同的博弈局势才能将客观博弈局势作为长期记忆储存在自身的主观认知中;因此,定义长期记忆状态矩阵为储存在自身的主观认知中;因此,定义长期记忆状态矩阵为为个体i在公共品博弈中的客观博弈矩阵,定义为个体i对博弈局势的主观认知矩阵;个体i学习客观博弈局势进而形成自身主观认知的过程需要长期记忆状态矩阵的辅助,即对与进行hadamard积运算:
[0032][0033]一种计算机存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述的一种基于异质性声誉回报的公共品博弈建模与仿真方法。
[0034]一种计算机设备,包括储存器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的一种基于异质性声誉回报的公共品博弈建模与仿真方法。
[0035]有益效果:与现有技术相比,本专利技术具有如下优点:
[0036]1、在异质性声誉回报机制的作用下,系统中的个体改善了其对背叛策略过度依赖的局面,在一定程度上抑制了多人博弈情境下的搭便车行为,维系了群体间高水平的合作;
[0037]2、本专利技术所得结果为群体合作行为演化的研究提供了新的视角——基于主观博弈的视角,并对帮助解决群体合作困境问题具有一定的实际意义。
附图说明
[0038]图1为本专利技术建模过程中主体策略更新的过程。
[0039]图2为本专利技术实施例提供的异质性声誉回报主观博弈模型构建方法流程图。
[0040]图3为本专利技术实施例提供的在不同异质性回报系数a情况下,协同因子r与合作水平ρ
c
的关系图,从下到上分别为a为0、0.2、0.6、1的对应关系图。
[0041]图4为本专利技术实施例提供的在不同声誉系数P情况下,协同因子r与合作水平ρ
c
的关系图,从下到上分别为P为1、5、10、30的对应关系图。
[0042]图5本专利技术实施例提供的所得出的在协同因子为3.5,不同a和P的组合下,系统平均收益的演化图。
具体实施方式
[0043]下面结合附图对本专利技术的技术方案作进一步说明。
[0044]如图2所示,一种基于异质性声誉回报的公共品博弈建模与仿真方法,包括以下步
骤:
[0045]1、建立二维方格子网络,进行多轮次的公共品博弈;
[0046]2、通过主观学习的策略更新规则,系统中的个体行为选本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于异质性声誉回报的公共品博弈建模与仿真方法,其特征在于,包括以下步骤:(1)构建多人公共品博弈模型;(2)多人主观博弈下主体策略的更新;(3)构建基于异质性回报的声誉监督机制;(4)构建主观认知矩阵。2.根据权利要求1所述的一种基于异质性声誉回报的公共品博弈建模与仿真方法,其特征在于,所述步骤(1)具体为:个体在初始化时被随机分配在二维网格的任意位置;博弈开始时,个体在方格子网络上随机游走,依据moore型规则挑选出n

1个邻居组成一个博弈小组G
l
;个体只参加一个群组的公共品博弈,并且在博弈过程中只能采取相同的策略s——合作C或背叛D。3.根据权利要求1所述的一种基于异质性声誉回报的公共品博弈建模与仿真方法,其特征在于,所述步骤(2)具体为:(2.1)将公共品博弈局势建模为一种固定的规则,根据每一轮博弈后,组内采取合作C背叛D的人数以及自身的策略,将博弈规则划分为2*n种局势,每一种局势都对应一个收益值π
i
;个体能够从每一轮的收益得知当前的策略分布情况;(2.2)个体被赋予短期记忆m,即它能够记住最近m轮博弈中所选策略s对应的收益情况;个体根据当前的博弈局势以及自身的主观认知对所采取的策略s产生相应的刺激R,刺激R经过演化产生对策略s的吸引力A,依据改进的Logistic转换方程计算下一轮策略s被选择的概率:其中,表示t时刻个体i选择策略s的概率,参数λ
i
反映了个体i对刺激的敏感程度,表示t时刻个体i关于策略s的吸引力,吸引力由个体过去关于策略选择的主观认知所形成。4.根据权利要求1所述的一种基于异质性声誉回报的公共品博弈建模与仿真方法,其特征在于,所述步骤(3)具体为...

【专利技术属性】
技术研发人员:程喆王愚
申请(专利权)人:扬州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1