一种基于随机博弈获取群智感知激励策略的方法及装置制造方法及图纸

技术编号:19216383 阅读:24 留言:0更新日期:2018-10-20 06:57
本发明专利技术实施例提供一种基于随机博弈获取群智感知激励策略的方法及装置,所述方法包括:获取任务发布者的预算信息、任务参与者当前的位置信息和所述任务参与者已执行的当前任务的所在地信息;根据预设的报酬计算函数、所述预算信息、所述位置信息和所述所在地信息,计算所述任务参与者执行完成当前任务所能获得的直接收益;获取与所述所在地信息位置相关的待完成任务,并获取完成所述待完成任务的期望报酬之和;根据所述直接收益和所述期望报酬之和,构建行为概率的博弈矩阵;并分析博弈矩阵的求解结果以获取群智感知激励策略。所述装置执行上述方法。本发明专利技术实施例提供的方法及装置,能够合理获取该行为概率,进而给出有效的激励策略。

【技术实现步骤摘要】
一种基于随机博弈获取群智感知激励策略的方法及装置
本专利技术实施例涉及博弈
,具体涉及一种基于随机博弈获取群智感知激励策略的方法及装置。
技术介绍
近年来,随着无线通信以及科学技术的迅猛发展,智能手机等智能设备越来越普及,其计算感知能力越来越强大。智能设备内嵌摄像头、加速传感器、全球定位系统(GPS)等感知设备,用户可通过感知设备感知周围环境信息,“移动群智感知”即为这样一种新的感知模式,将参与者携带的智能感知设备看成基本感知单元,大量参与者利用其完成大规模复杂的感知任务,帮助专业人士收集和分析数据。如果所有智能感知设备都参与获取感知数据任务,感知网络将成为最大的网络。因此用户参与度对系统是否能够获取高质量感知数据起至关重要的作用。然而在机会网络中传输数据时会消耗电池、网络流量,上传数据过程中也会暴露用户的位置信息。由于用户的自私性,用户不愿意自愿完成任务,因此为了确保数据的覆盖率以及可靠性,需要采取适当的激励机制提高用户参与积极性。然而目前关于移动群智感知的激励算法,均未考虑到用户的不确定性,即使给出用户很高的报酬,用户可能出于对任务的难度、任务的距离等问题的考虑,不会选择完成该任务。因此,如何避免上述缺陷,合理获取反映任务参与者执行待完成任务意愿的行为概率,并分析该行为概率,进而给出有效的激励策略,成为亟须解决的问题。
技术实现思路
针对现有技术存在的问题,本专利技术实施例提供一种基于随机博弈获取群智感知激励策略的方法及装置。第一方面,本专利技术实施例提供一种基于随机博弈获取群智感知激励策略的方法,所述方法包括:获取任务发布者的预算信息、任务参与者当前的位置信息和所述任务参与者已执行的当前任务的所在地信息;根据预设的报酬计算函数、所述预算信息、所述位置信息和所述所在地信息,计算所述任务参与者执行完成当前任务所能获得的直接收益;获取与所述所在地信息位置相关的待完成任务,并获取完成所述待完成任务的期望报酬之和;根据所述直接收益和所述期望报酬之和,构建反映所述任务参与者执行所述待完成任务意愿的行为概率的博弈矩阵;求解所述博弈矩阵的纳什均衡,并将所述纳什均衡作为所述博弈矩阵的求解结果,分析所述求解结果以获取群智感知激励策略。第二方面,本专利技术实施例提供一种基于随机博弈获取群智感知激励策略的装置,所述装置包括:第一获取单元,用于获取任务发布者的预算信息、任务参与者当前的位置信息和所述任务参与者已执行的当前任务的所在地信息;计算单元,用于根据预设的报酬计算函数、所述预算信息、所述位置信息和所述所在地信息,计算所述任务参与者执行完成当前任务所能获得的直接收益;第二获取单元,用于获取与所述所在地信息位置相关的待完成任务,并获取完成所述待完成任务的期望报酬之和;构建单元,用于根据所述直接收益和所述期望报酬之和,构建反映所述任务参与者执行所述待完成任务意愿的行为概率的博弈矩阵;求解所述博弈矩阵的纳什均衡,并将所述纳什均衡作为所述博弈矩阵的求解结果,分析所述求解结果以获取群智感知激励策略。第三方面,本专利技术实施例提供一种电子设备,包括:处理器、存储器和总线,其中,所述处理器和所述存储器通过所述总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如下方法:获取任务发布者的预算信息、任务参与者当前的位置信息和所述任务参与者已执行的当前任务的所在地信息;根据预设的报酬计算函数、所述预算信息、所述位置信息和所述所在地信息,计算所述任务参与者执行完成当前任务所能获得的直接收益;获取与所述所在地信息位置相关的待完成任务,并获取完成所述待完成任务的期望报酬之和;根据所述直接收益和所述期望报酬之和,构建反映所述任务参与者执行所述待完成任务意愿的行为概率的博弈矩阵;求解所述博弈矩阵的纳什均衡,并将所述纳什均衡作为所述博弈矩阵的求解结果,分析所述求解结果以获取群智感知激励策略。第四方面,本专利技术实施例提供一种非暂态计算机可读存储介质,包括:所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如下方法:获取任务发布者的预算信息、任务参与者当前的位置信息和所述任务参与者已执行的当前任务的所在地信息;根据预设的报酬计算函数、所述预算信息、所述位置信息和所述所在地信息,计算所述任务参与者执行完成当前任务所能获得的直接收益;获取与所述所在地信息位置相关的待完成任务,并获取完成所述待完成任务的期望报酬之和;根据所述直接收益和所述期望报酬之和,构建反映所述任务参与者执行所述待完成任务意愿的行为概率的博弈矩阵;求解所述博弈矩阵的纳什均衡,并将所述纳什均衡作为所述博弈矩阵的求解结果,分析所述求解结果以获取群智感知激励策略。本专利技术实施例提供的基于随机博弈获取群智感知激励策略的方法及装置,通过构建反映任务参与者执行待完成任务意愿的行为概率的博弈矩阵;并分析博弈矩阵的求解结果获取群智感知激励策略,能够合理获取该行为概率,进而给出有效的激励策略。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例基于随机博弈获取群智感知激励策略的方法流程示意图;图2为本专利技术实施例待完成任务的轨迹分布图;图3为本专利技术实施例待完成任务的任务转化图;图4为本专利技术实施例基于随机博弈获取群智感知激励策略的装置结构示意图;图5为本专利技术实施例提供的电子设备实体结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。图1为本专利技术实施例基于随机博弈获取群智感知激励策略的方法流程示意图,如图1所示,本专利技术实施例提供的一种基于随机博弈获取群智感知激励策略的方法,包括以下步骤:S101:获取任务发布者的预算信息、任务参与者当前的位置信息和所述任务参与者已执行的当前任务的所在地信息。具体的,装置获取任务发布者的预算信息、任务参与者当前的位置信息和所述任务参与者已执行的当前任务的所在地信息。任务可以包括去某地采集任务发布者所需要的数据,数据类型可以为噪音感知数据、实时公交信息感知数据、空气质量感知数据、交通拥堵情况感知数据和公共基础设施感知数据等。预算信息可以理解为任务发布者让任务参与者完成任务所支付报酬的预算。位置信息和所在地信息可采用地理坐标或经纬度等表示,不作具体限定。S102:根据预设的报酬计算函数、所述预算信息、所述位置信息和所述所在地信息,计算所述任务参与者执行完成当前任务所能获得的直接收益。具体的,装置根据预设的报酬计算函数、所述预算信息、所述位置信息和所述所在地信息,计算所述任务参与者执行完成当前任务所能获得的直接收益。可以根据如下公式计算所述直接收益:其中,Rw为直接收益、α为占Rw的预设比例、β为li×w占Rw的预设比例,且α+本文档来自技高网...

【技术保护点】
1.一种基于随机博弈获取群智感知激励策略的方法,其特征在于,包括:获取任务发布者的预算信息、任务参与者当前的位置信息和所述任务参与者已执行的当前任务的所在地信息;根据预设的报酬计算函数、所述预算信息、所述位置信息和所述所在地信息,计算所述任务参与者执行完成当前任务所能获得的直接收益;获取与所述所在地信息位置相关的待完成任务,并获取完成所述待完成任务的期望报酬之和;根据所述直接收益和所述期望报酬之和,构建反映所述任务参与者执行所述待完成任务意愿的行为概率的博弈矩阵;求解所述博弈矩阵的纳什均衡,并将所述纳什均衡作为所述博弈矩阵的求解结果,分析所述求解结果以获取群智感知激励策略。

【技术特征摘要】
1.一种基于随机博弈获取群智感知激励策略的方法,其特征在于,包括:获取任务发布者的预算信息、任务参与者当前的位置信息和所述任务参与者已执行的当前任务的所在地信息;根据预设的报酬计算函数、所述预算信息、所述位置信息和所述所在地信息,计算所述任务参与者执行完成当前任务所能获得的直接收益;获取与所述所在地信息位置相关的待完成任务,并获取完成所述待完成任务的期望报酬之和;根据所述直接收益和所述期望报酬之和,构建反映所述任务参与者执行所述待完成任务意愿的行为概率的博弈矩阵;求解所述博弈矩阵的纳什均衡,并将所述纳什均衡作为所述博弈矩阵的求解结果,分析所述求解结果以获取群智感知激励策略。2.根据权利要求1所述的方法,其特征在于,所述根据预设的报酬计算函数、所述预算信息、所述位置信息和所述所在地信息,计算所述任务参与者执行完成当前任务所能获得的直接收益,包括:根据如下公式计算所述直接收益:其中,Rw为直接收益、α为占Rw的预设比例、β为li×w占Rw的预设比例,且α+β=1;hi为第i个任务完成难易程度的大小、K为任务总数、B为任务发布者的总预算、li为所述位置信息对应的位置与所述所在地信息对应的位置之间的距离、w为预设单位距离对应的报酬。3.根据权利要求1所述的方法,其特征在于,所述并获取完成所述待完成任务的期望报酬之和,包括:计算所述任务发布者在支付当前任务的报酬为Ti的条件下,所述任务参与者在博弈状态Sl下采取动作Wj的概率其中,动作Wj表示从所述当前任务的所在地k到待完成任务的待去所在地l的概率;根据如下公式计算所述期望报酬之和:其中,Tl为所述任务参与者从所述当前任务的所在地k到所述待去所在地l,并完成所述待完成任务时,所述任务发布者支付的报酬。4.根据权利要求1所述的方法,其特征在于,所述根据所述直接收益和所述期望报酬之和,构建反映所述...

【专利技术属性】
技术研发人员:陈昕李卓陈莹赵禹哲
申请(专利权)人:北京信息科技大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1