The invention belongs to the field of communication technology, in particular to a group intelligence perception incentive method based on online observation quality of user observation. The method of the invention is in the continuous time perception task scenarios, using reverse auction framework, with a multi arm slot machine model of user perceived quality of online learning, users get quality information, and in each cycle of user perception perception, according to the current bid and learn the user's perception of the quality of selection, the optimization objective is to obtain the total perception system the largest gains in the perception task in time. The invention provides CMAB DC algorithm for online learning, each sensing period, using the algorithm given the current observation quality estimate user selection, can effectively deal with the dynamic changes of the user's bid. The upper limit of the system income loss between the user selection strategy and the theoretical optimal policy generated by the method of the invention is
【技术实现步骤摘要】
一种基于用户观测质量在线学习的群智感知激励方法
本专利技术属于通信
,具体涉及基于用户观测质量在线学习的群智感知激励方法,进一步,具体涉及在连续时间感知任务场景下,利用逆向拍卖框架,采用多臂老虎机(Multi-armedbandits)模型进行用户感知质量在线学习的群智感知激励方法。
技术介绍
近年来,智能手机、平板电脑等移动智能设备数量飞速增长,同时它们拥有了越来越强大的计算能力和日益丰富的传感器,如摄像头、陀螺仪、GPS定位模块等,因此具备了数据收集及处理的能力。群智感知(Crowdsensing)正是在这样的背景产生,它是众包(Crowdsourcing)思想和移动感知的结合,通过将感知任务分发给移动用户,利用用户拥有的移动设备形成感知网络,达到数据收集和信息共享的目的,从而为请求用户提供感知服务[1],系统结构如图1所示。群智感知是一种全新的数据收集模式,能充分高效的利用移动设备资源,相对于传统的无线传感器网络,具有更广泛的感知覆盖范围、更强的灵活性和更低的感知成本[2]等优点。目前,群智感知在学术研究和实际应用中都得到了广泛关注,并已应用于空气质量检测[3]、噪音监测[4]、室内定位[5][6]和健康服务等领域。激励机制(也称激励方法)设计是群智感知系统中重要的研究课题。一方面,移动用户在参与感知的过程中需要付出时间、能量及数据传输成本;另一方面,群智感知系统需要足够多的参与用户来保证充分的收集数据,因此系统需要采用合适的激励机制来调动用户的积极性,吸引更多的用户参与到感知任务中。近年来,针对群智感知系统中的激励问题出现了许多有价值的研究工 ...
【技术保护点】
一种基于用户观测质量在线学习的群智感知激励方法,其特征在于,在连续时间感知任务场景下,利用逆向拍卖框架,采用多臂老虎机模型进行用户感知质量在线学习,得到用户质量信息,并在每个感知周期,根据用户的当前出价和学习的感知质量进行感知用户的选择,优化目标为在任务感知时间内获得最大的系统感知总收益。
【技术特征摘要】
1.一种基于用户观测质量在线学习的群智感知激励方法,其特征在于,在连续时间感知任务场景下,利用逆向拍卖框架,采用多臂老虎机模型进行用户感知质量在线学习,得到用户质量信息,并在每个感知周期,根据用户的当前出价和学习的感知质量进行感知用户的选择,优化目标为在任务感知时间内获得最大的系统感知总收益。2.根据权利要求1所述的基于用户观测质量在线学习的群智感知激励方法,其特征在于,所述逆向拍卖框架描述如下:将整个感知任务按时间划分为多个感知周期进行处理,每个感知周期是一次完整的逆向拍卖过程;考虑一个观测时间为个感知周期的任务,感知系统由感知平台和个参与用户组成,用户集记为;每个感知周期内,平台和用户之间进行的拍卖过程为:1)平台将任务广播给区域内的用户;2)用户向平台反馈自己的感知成本作为出价;3)平台根据一定准则进行用户的选择并告知用户选出的用户集,包含的用户即为本次拍卖的赢家;4)被选中的用户在本感知周期进行数据收集并按时将数据传回平台;5)在当前感知周期结束前,平台确定并支付中各用户的报酬;将所有用户在第个周期的出价记为,其中为第个用户的出价,不同周期某个用户的出价可能变化;如果在某个周期有部分用户放弃出价,可以将这些用户在当前周期的出价记为无穷大,以此将其从用户选择过程中排除;周期内用户的有效观测次数记为,不同周期内用户的有效观测次数独立同分布,随机分布的均值为,则所有用户的观测质量均值记为;不失一般性,将归一化至区间,其中为用户最小观测质量;所述用户的选择准则如下:若在周期选择的用户集为,该周期内任务总有效感知次数的期望表示为选择用户观测质量均值之和,即:(1)在该周期的期望收益为任务回报和支付给用户报酬之差,即:(2)其中,函数...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。