一种动态博弈访问控制奖惩激励约束方法技术

技术编号：21308855 阅读：56 留言：0更新日期：2019-06-12 10:55

本发明专利技术公开一种动态博弈访问控制奖惩激励约束方法，针对开放式网络环境下网络交互实体不诚信合作的交互访问行为，建立了基于信任的动态访问控制博弈模型，并通过设计的奖惩激励约束机制促使交互实体在自身利益驱动下理性选择系统(设计者)期望的策略，实现符合目标(访问控制策略)要求的实体间总体均衡状态。

A Dynamic Game Method of Incentive and Restriction for Access Control

The invention discloses a dynamic game access control incentive and constraint method. Aiming at the dishonest and cooperative interactive access behavior of network interactive entities under open network environment, a trust-based dynamic access control game model is established, and through the designed incentive and constraint mechanism, interactive entities can reasonably select the desired strategy of the system (designer) driven by their own interests. Achieve the overall equilibrium between entities that meet the requirements of the target (access control strategy).

全部详细技术资料下载

【技术实现步骤摘要】
一种动态博弈访问控制奖惩激励约束方法
本专利技术属于机制设计
，尤其涉及一种动态博弈访问控制奖惩激励约束方法。
技术介绍
机制设计理论是最近20年科学领域中发展最快的一个研究分支，机制设计理论的研究起源于2007年诺贝尔经济奖获得者——美国明尼苏达大学经济学教授利奥·赫尔维茨1960年和1972年开创性工作。对于任意给定的(经济、社会或系统)实现目标，在自由选择、理性自愿、信息不完全等分散化决策条件下，通过机制设计使行为的参与者个人利益和即定目标一致。目前解决了不同网络环境下网络交互实体间行为的激励约束机制，但没有涉及到实体行为的理性选择策略，在遏制不诚信实体行为方面的效果不理想。
技术实现思路
本专利技术借鉴以上访问控制和激励机制相关问题已有研究的基础上，针对开放式网络环境下网络交互实体不诚信合作的交互访问行为，建立了基于信任的动态访问控制博弈模型，并通过设计的奖惩激励约束机制促使交互实体在自身利益驱动下理性选择系统(设计者)期望的策略，实现符合目标(访问控制策略)要求的实体间总体均衡状态。为实现上述目的，本专利技术采用如下的技术方案：一种动态博弈访问控制奖惩...

【技术保护点】
1.一种动态博弈访问控制奖惩激励约束方法，其特征在于，包括以下步骤：步骤1初始化阶段，网络交互实体处于交互等待状态，同时实体结点也处于交互混合监听状态，从博弈模型机制中获得初始化参数(N，S，p,…,T)，评估判断节点的行为的诚信类别(honest，dishonest)和诚信程度；步骤2当交互实体诚信访问时，触发奖励激励机制；判断相关收益所满足条件，由系统设置合适的奖励因子

【技术特征摘要】
1.一种动态博弈访问控制奖惩激励约束方法，其特征在于，包括以下步骤：步骤1初始化阶段，网络交互实体处于交互等待状态，同时实体结点也处于交互混合监听状态，从博弈模型机制中获得初始化参数(N，S，p,…,T)，评估判断节点的行为的诚信类别(honest，dishonest)和诚信程度；步骤2当交互实体诚信访问时，触发奖励激励机制；判断相关收益所满足条件，由系统设置合适的奖励因子激励主体自觉选择诚信访问转向步骤4；步骤3交互实体不诚信访问时，触发惩罚激励约束机制；判断评估不诚信行为实体的诚信程度决策出惩罚力度；当To→s＜θ||k＞＝Nset时，惩罚达到最大，直接拒绝访问；步骤4评估交互结果，反馈相关参数。2.如权利要求1所述的动态博弈访问控制奖惩激励约束方法，其特征在于，在奖惩激励约束机制下，如果访问主体能够按照机制设计目的采取诚信访问行为(honest)，将通过奖励因子适当提高访问主体选择诚信访问的预期总回报收益幅度来激励约束主体行为，如果访问主体采取欺诈访问，视情况加以惩罚直到将其永远得不到该访问客体的访问许可。3.如权利要求1所述的动态博弈访问控制奖惩激励约束方法，其特征在于，奖惩激励约束机制为：(1)奖励激励约束机制奖励原则是：访问主体选择诚信访问策略时，激励约束机制通过增加其收益值来激励访问主体，提高其信任评估值，使其获得更多的访问许可权限。采用α表示直接信任，δ表示推荐信任，γ表示实体和网络决策属性因素，ρ表示后验概率，奖励因子可以表示为α，δ，γ和ρ的函数，即：在其它变量不变的情况下，根据各种因素的变化来进行修正其值，不断随着α，δ，γ的增大而变大；能够在开放的网络环境中没有任何严格假设情况下正确反映主体诚信行为的可信度和激励性，网络交互过程中，假设访问主体的奖励因子为则t1时刻访问主体选择诚信访问的预期收益为：则ti时刻访问主体选择诚信访问的预期总回报收益为：则当前访问主体选择不诚信访问的预期收益为：Rdish＝p*Sn.ta.u.inco+(1-p)*Sn.nta.u...

【专利技术属性】
技术研发人员：赵斌，肖创柏，古雪，
申请(专利权)人：北京工业大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人