一种基于数据质量的移动群智感知在线定价方法和系统技术方案

技术编号:21573324 阅读:38 留言:0更新日期:2019-07-10 15:52
本发明专利技术提供一种基于数据质量的移动群智感知在线定价方法和系统,方法包括:获取移动群智感知任务;对所述移动群智感知任务构建马尔可夫决策过程模型,从所述马尔可夫决策过程模型中选择所述移动群智感知任务的初始价格并发布;根据基于连续型Actor‑Critic算法的策略发布所述移动群智感知任务的质量要求;获取用户的数据质量、用户的动作选择,根据所述马尔可夫决策过程模型计算招募用户所得到的奖励并确定招募结果;根据所述招募结果和所述马尔可夫决策过程模型,将标价转移到下一个价格并等待下一个用户到来直到耗尽预算或无更多的用户到来。在招募合适的感知任务参与者并尽可能提高数据质量以实现平台利润最大化。

A Mobile Group Intelligence Perception Online Pricing Method and System Based on Data Quality

【技术实现步骤摘要】
一种基于数据质量的移动群智感知在线定价方法和系统
本专利技术涉及移动群智感知
,尤其涉及一种基于数据质量的移动群智感知在线定价方法和系统。
技术介绍
近年来,移动群智感知为大规模感知任务提供了新的形式。移动终端处理器、内存等硬件设备的快速发展和提升,移动设备领域得到了繁荣发展,摄像头、麦克风、GPS、陀螺仪、加速度计等传感器嵌入到以智能手机、平板电脑为代表的智能移动终端中,提供了高效的收集数据的方式。因此,出现了许多移动群智感知应用,例如AmazonMechanicalTurk作为一个在线众包平台,VTrack则通过群智感知的方式提供交通信息以及Sensorly则用来构建蜂窝网/WiFi网络的覆盖地图。在实际应用中,一个经典的移动群智感知系统通常包括三部分。第一部分是数据需求者,他们将需要完成的感知任务及相应的预算提交给平台;第二部分是一组移动设备用户,他们利用移动设备完成感知任务数据的收集并获得相应的回报;第三部分是平台,作为中介,接收数据需求者的任务请求,选择合适的用户完成相应的任务,支付相应的报酬,最终将收集到的数据返回给数据需求者。平台通过将用户收集到的数据出售给数据需求者来获得利润。然而,用户通过消耗自己的计算、人力等资源来参与感知任务,同时,一些任务要求用户提交一些敏感信息,这影响到了用户的隐私。因此,如何激励用户参与群智感知任务是一个重要的问题。移动群智感知系统中的数据质量问题,由于用户设备以及完成任务的熟练度的不同,采集到的数据质量会有很大的差异。高质量的数据将带来更高的价值,但是通常用户需要更高的成本,因此,设计一个好的激励机制来招募合适的用户完成相应的感知任务是非常有意义的。目前常见的激励用户的方法大多基于拍卖机制,大多数激励机制针对于离线场景,即平台等待足够多的用户到达后采用逆向拍卖的模式来选择合适的用户参与感知任务。然而在实际中,用户总是随机来到平台,观察过相关任务要求及相应回报后,立即选择是否参加该任务。有部分激励机制考虑到了在线场景,但大多对任务类型作出了过多假设或者假设平台对用户的成本或其分布是已知的。此外,数据质量也同样是移动群智感知系统中一个重要的因素。因此,如何设计一个在线环境下基于数据质量且未知用户成本信息的移动群智感知激励机制是一个非常具有挑战的问题。
技术实现思路
本专利技术为了解决现有技术中缺乏一种在线环境下基于数据质量且未知用户成本信息移动群智感知激励机制问题,提供一种基于数据质量的移动群智感知在线定价方法和系统。为了解决上述问题,本专利技术采用的技术方案如下所述:一种基于数据质量的移动群智感知在线定价方法,包括如下步骤:S1:获取移动群智感知任务,所述移动群智感知任务包括:任务内容,任务预算,质量要求;S2:对所述移动群智感知任务构建马尔可夫决策过程模型,从所述马尔可夫决策过程模型中选择所述移动群智感知任务的初始价格并发布;S3:根据基于连续型Actor-Critic算法的策略发布所述移动群智感知任务的质量要求;S4:获取用户的数据质量、用户的动作选择,根据所述马尔可夫决策过程模型计算招募用户所得到的奖励并确定招募结果;若奖励大于零,则表示成功招募所述用户,支付价格给所述用户;若奖励小于零,则表示未成功招募所述用户;S5:根据所述招募结果和所述马尔可夫决策过程模型,将标价转移到下一个价格并等待下一个用户到来直到耗尽预算或无更多的用户到来。在本专利技术的一种实施例中,构建所述马尔可夫决策过程模型包括:构建状态空间、构建动作空间、构建奖励定义和构建转移概率。在本专利技术的又一种实施例中,其特征在于,所述构建状态空间包括:根据所述任务预算对所述移动群智感知任务设置定价集合S={s1,s2,...,sm},对集合S进行归一化使其满足0<s1<s2...<sm≤1,且每档定价之间的间隔相等,即为所述状态空间;所述构建动作空间包括:根据所述质量要求对所述移动群智感知任务设置备选质量要求集合A={a1,a2,...,al},所述集合A满足qmin≤a1<a2<...<al≤qmax,其中qmin和qmax分别定义为用户最小的质量等级与最大的质量等级,所述集合A即为动作空间;所述构建奖励定义如下:其中,T是一个负常数,为未能招募到合适用户的惩罚项;s是对所述移动群智感知任务的标价,a是对所述移动群智感知任务的质量要求,λ是获取的数据质量与支付价格之间的关系,c是所述用户完成所述移动群智感知任务的成本,q表示所述用户的数据质量。所述标价转移到下一个价格按照如下公式进行:其中,st是对所述移动群智感知任务的当前标价,at是对所述移动群智感知任务当前的质量要求,c是所述用户完成所述移动群智感知任务的成本,q表示所述用户的数据质量;且st-1<st<st+1;若所述用户加入所述移动群智感知任务,则所述标价转移至st-1,反之转移到st+1。所述标价转移的转移概率P计算如下:P(st-1|st,at)=PC(st)·PQ(at)P(st+1|st,at)=1-PC(st)·PQ(at)其中PC(·)所有用户消耗成本的累计分布函数与数据质量的累计分布函数。在本专利技术的再一种实施例中,通过发布标准任务给所述用户执行获取用户的数据质量;获取至少一个所述移动群智感知任务。本专利技术还提供一种基于数据质量的移动群智感知在线定价方法,包括:任务提供端,用于向服务平台发送移动群智感知任务,并从服务平台获取移动群智感知数据;服务平台,用于实现如上任一所述的方法;个人移动端,用于根据自身情况选择所述移动群智感知任务,完成所述移动群智感知任务并将所述移动群智感知数据发送给服务平台。本专利技术的有益效果为:提供一种基于数据质量的移动群智感知在线定价方法和系统,将数据质量的影响纳入移动群智感知激励机制的设计之中,通过应用马尔可夫决策过程的方法建立问题模型,提出了一种在线定价与质量要求的在线激励的方法,可以用于以任意序列到达平台的用户;并通过设计相关算法实现相关特性,在招募合适的感知任务参与者并尽可能提高数据质量以实现平台利润最大化。附图说明图1是本专利技术实施例中一种基于数据质量的移动群智感知在线定价方法示意图。图2是本专利技术实施例中一种基于数据质量的移动群智感知在线定价模型示意图。图3是本专利技术实施例中一种基于数据质量的移动群智感知在线定价系统示意图。其中,1-服务平台,2-任务提供端,3-个人移动端。具体实施方式为了使本专利技术实施例所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。需要说明的是,当元件被称为“固定于”或“设置于”另一个元件,它可以直接在另一个元件上或者间接在该另一个元件上。当一个元件被称为是“连接于”另一个元件,它可以是直接连接到另一个元件或间接连接至该另一个元件上。另外,连接即可以是用于固定作用也可以是用于电路连通作用。需要理解的是,术语“长度”、“宽度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术实施例和简化描述,而不是指示或暗示所指的装置或本文档来自技高网
...

【技术保护点】
1.一种基于数据质量的移动群智感知在线定价方法,其特征在于,包括如下步骤:S1:获取移动群智感知任务,所述移动群智感知任务包括:任务内容,任务预算,质量要求;S2:对所述移动群智感知任务构建马尔可夫决策过程模型,从所述马尔可夫决策过程模型中选择所述移动群智感知任务的初始价格并发布;S3:根据基于连续型Actor‑Critic算法的策略发布所述移动群智感知任务的质量要求;S4:获取用户的数据质量、用户的动作选择,根据所述马尔可夫决策过程模型计算招募用户所得到的奖励并确定招募结果;若奖励大于零,则表示成功招募所述用户,支付价格给所述用户;若奖励小于零,则表示未成功招募所述用户;S5:根据所述招募结果和所述马尔可夫决策过程模型,将标价转移到下一个价格并等待下一个用户到来直到耗尽预算或无更多的用户到来。

【技术特征摘要】
1.一种基于数据质量的移动群智感知在线定价方法,其特征在于,包括如下步骤:S1:获取移动群智感知任务,所述移动群智感知任务包括:任务内容,任务预算,质量要求;S2:对所述移动群智感知任务构建马尔可夫决策过程模型,从所述马尔可夫决策过程模型中选择所述移动群智感知任务的初始价格并发布;S3:根据基于连续型Actor-Critic算法的策略发布所述移动群智感知任务的质量要求;S4:获取用户的数据质量、用户的动作选择,根据所述马尔可夫决策过程模型计算招募用户所得到的奖励并确定招募结果;若奖励大于零,则表示成功招募所述用户,支付价格给所述用户;若奖励小于零,则表示未成功招募所述用户;S5:根据所述招募结果和所述马尔可夫决策过程模型,将标价转移到下一个价格并等待下一个用户到来直到耗尽预算或无更多的用户到来。2.如权利要求1所述的基于数据质量的移动群智感知在线定价方法,其特征在于,构建所述马尔可夫决策过程模型包括:构建状态空间、构建动作空间、构建奖励定义和构建转移概率。3.如权利要求2所述的基于数据质量的移动群智感知在线定价方法,其特征在于,所述构建状态空间包括:根据所述任务预算对所述移动群智感知任务设置定价集合S={s1,s2,...,sm}对集合S进行归一化使其满足0<s1<s2...<sm≤1,且每档定价之间的间隔相等,即为所述状态空间。4.如权利要求2所述的基于数据质量的移动群智感知在线定价方法,其特征在于,所述构建动作空间包括:根据所述质量要求对所述移动群智感知任务设置备选质量要求集合A={a1,a2,...,al}所述集合A满足qmin≤a1<a2<...<al≤qmax,其中qmin和qmax分别定义为用户最小的质量等级与最大的质量等级,所述集合A即为动作空间。5.如权利要求2所述的基于数据质量的移动群智感知...

【专利技术属性】
技术研发人员:江勇李丽梁甲琛
申请(专利权)人:清华大学深圳研究生院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1