一种用于多源空间信息众包式采集的任务激励方法技术

技术编号:39844991 阅读:8 留言:0更新日期:2023-12-29 16:42
本发明专利技术一种用于多源空间信息众包式采集的任务激励方法,包括以下步骤:获取当前时间众包式采集任务,确定初始当前时间众包式采集任务的初始价格;构建用于表示当前时间任务的

【技术实现步骤摘要】
一种用于多源空间信息众包式采集的任务激励方法


[0001]本专利技术属于全自动化产品领域,涉及一种用于多源空间信息众包式采集的任务激励方法


技术介绍

[0002]所谓“空间信息众包式采集”,即把空间信息采集

更新的任务交给非组织内的拥有采集设备的人
(
统称采集者
)
,利用其传感器实时检测空间环境信息,将数据上传至云平台,实现空间数据的快速更新

在移动互联网和大数据迅速发展的时代,众包是一种有效的收集数据的方式,陆







网络等数据分享能够为国防对抗

政府决策

企业发展和群众生活提供更多的空间信息支持

然而,参与信息采集是有成本的,如移动设备的电池使用量

时间消耗,可能会阻碍采集者的积极性

因此,补偿采集者成本的激励方法至关重要

由于每个采集者贡献的感知质量和他们的心理价位未知,很难决定每个人的激励措施

若给采集者的奖励过高会浪费预算,而奖励过低可能会鼓励他们以最低的成本提交传感数据,这会导致传感数据的质量不佳

为提高信息采集和加工的准确性以及传输的时效性,目前迫切需要通过一种有效的激励机制从而可以大大提高信息采集和加工的准确性以及传输的时效性

[0003]在当前的研究中,多数研究者考虑的平台激励机制的方法是“贡献越多,奖励越高”和“质量越高,奖励越高”的模式,平台会通过人工或数据化等多种方式记录采集者在完成任务时所做的贡献或质量,然后通过采集者的贡献或质量分配利润,这种直观的方式能够让工作人员公平的获得其利润,这种情况仅考虑了完成任务后怎么分配奖励,但是没有考虑初始任务的价格以及环境因素,例如采集者能力和任务模式等

当前研究所考虑的参数越来越多,将多源信息融合到一起,因此会定义采集者自身的一些能力值,比如专业程度

能力值和信誉分等能够衡量采集者能力的值,平台通过采集者完成情况更新其自身的参数,然后根据采集者能力分配利润,这种情况没有考虑环境冷启动问题和任务采集者参数匹配问题,会造成一定量的参数偏差

随着考虑的数据越来越多,也有一些研究者开始考虑任务参数,让同类别的采集者去完成同类别的任务,但是当一个平台不断有人发布任务时,平台的任务基数会特别大,采集者没办法选到符合自己的任务,这是就有其他研究者提出任务推荐功能,将同类别
/
领域的任务推荐到相关的采集者处,而且更有一些研究者提出了一些非利润化的激励措施,比如使用虚拟积分

等级化和游戏化等措施,让众包激励机制更加完善

但是当前还存在一个问题就是任务的初始价格的定制,如果单个任务的初始价格定制不合理,也会在心理上对采集者造成一定的影响,影响采集者参与平台的积极性

任务定价问题一直是众包研究领域的热点和难点,因为采集者不愿意在没有足够的金钱补偿的情况下接受平台分配的任务

缺乏采集者参加,众包程序很难收集足够的数据来获得良好的服务质量

因此研究众包的激励机制,解决采集者在众包中的贡献不足的问题是必要和紧迫的

我们打算考虑更多环境信息来得出我们想要的价格

[0004]在估计任务价格时,需要考虑采集者心理价位的原因是在动态情况下采集者和任
务的随机到达

离开,并且各个区域的任务采集者比大有不同,所以用距离乘以每公里单价作为任务价格难以满足不同任务采集者比下采集者的心理价格

如果仅根据采集者附近的任务采集者比进行定价,则难以最大化任务完成率和总利润

需要找到一种估价方式以最大化总利润以及定价后分配任务的最大分配率

[0005]目前比较接近的是
Adish Singla

[1]提出的使用多臂赌博机进行任务估价,它先通过历史数据训练手臂,然后在使用时通过任务的信息选择手臂
(
价格
)。
训练“手臂”系数的做法是当一个任务出现时,根据任务当前信息和以往相似任务的价格作为依据来选择当前的任务价格,通过不同的选择结果持续计算收益

在使用时,它会根据当前任务的期望最大收益减去每个动作选择的期望收益得出每个手臂的遗憾值,最后判别出最佳动作

对于“手臂”的定义如下:每个手臂代表一个价格,十个手臂就是十个单价

[0006]以往的方法可以进行对任务进行估价主要有三种方式,但这三种方式都存在许多的不足

[0007]当前市场上最普遍的估价方法是用收集信息的距离乘以每公里单价

这种方式没有考虑市场上采集者和任务的分布以及数量比,在真实场景中,采集者和任务的数量总是相差很多的,由于不同场景下采集者的心理价位是不同的,所以这种估价方式的结果总是无法满足采集者的心理价位

[0008]第二种是用公式进行估价,通过对一个区域内的市场特点进行分析计算,得出一个多元一次方程,当任务到达区域内时,公式能够根据任务的相关信息得出价格

这种方式局限性比较大,每个公式的相关参数都是通过区域内的数据得出了,所以定价公式只能应用到当前的区域内,无法应用到其他区域,并且如果出现了以前没出现过的市场情况,公式定价也会出现问题

[0009]第三种是通过多臂赌博机动态学习的方式进行估价,每一个“手臂”都是一个价格,通过动态学习来判断当前任务最适合的价格是哪个

这种方法的学习速度比强化学习慢,并且可选价格的范围较难设置,如果手臂设置过多,学习速度会更慢,如果手臂设置过少,则所定价局限性过大,会造成部分估价不符合采集者心理价位

[0010]根据以上问题,我们使用强化学习调节估价公式的方法来进行任务估价,用以解决以上方法遗留的问题


技术实现思路

[0011]为了解决上述问题,本专利技术采用的技术方案是:一种用于多源空间信息众包式采集的任务激励方法,包括以下步骤:
[0012]获取当前时间众包式采集任务,确定初始当前时间众包式采集任务的初始价格;
[0013]构建用于表示当前时间任务的
MDP
模型,具体包含强化学习的
DQN
网络和时空众包任务执行环境;
[0014]通过将任务价格限定在正常区间并考虑采集者的心理价位,利用
MDP
模型中定义的奖励值计算回报值,将其作为训练目标;
[0015]对强化学习利用网络
DQN
进行训练,
DQN
网络本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种用于多源空间信息众包式采集的任务激励方法,其特征在于:包括以下步骤:获取当前时间众包式采集任务,确定初始当前时间众包式采集任务的初始价格;构建用于表示当前时间任务的
MDP
模型;所述
MDP
模型包括具体包含强化学习的
DQN
网络和时空众包任务执行环境;通过将任务价格限定在正常区间并考虑采集者的心理价位,利用
MDP
模型中定义的奖励值计算回报值,将其作为训练目标;对强化学习利用网络
DQN
进行训练,
DQN
网络以状态观测量为输入,以动作为输出,通过输出动作与时空众包任务执行环境的不断交互,沿途收取奖励值,然后更新当前网络动作策略,最终使得奖励之和最大,训练过程中策略梯度法与随机策略一起使用,收敛后每个状态对应的最有利动作的概率将最高,从而
DQN
网络将始终采取该动作;
DQN
网络根据当前的环境和任务特征,不断调整定价公式中的影响因子,以实现最优的决策策略;将当前时间众包式采集任务及初始当前时间众包式采集任务的初始价格输入到训练好的
DQN
网络中,实现采集者对分配后当前时间任务进行采集
。2.
根据权利要求1所述的一种用于多源空间信息众包式采集的任务激励方法,其特征在于:该方法应用在时空众包的环境下
。3.
根据权利要求2所述的一种用于多源空间信息众包式采集的任务激励方法,其特征在于:所述众包环境中存在采集者和任务节点;所述采集者用一个四元组
w
=<
id,l
w
,k
w
,r
w
>描述,其中
id
表示采集者的编号;
l
w
表示采集者位置;
r
w
表示可接任务半径,当任务在采集者的可接任务半径内时,被采集者查看到;
k
w
表示价格随等待时间的折扣系数;所述众包式采集任务用一个五元组
t
=<
ori
t
,des
t
,s
t
,e
t
,price
t
>描述,其中
ori
t
表示任务的开始位置,
des
t
表示任务的结束位置,
s
t
表示任务开始的时间,
e
t
表示任务的截止时间;
price
t
表示任务的价格,定义当前时间为
time
,当
s
t
≤time≤e
t
,称该任务为可用任务,被周围的采集者看到,属于可估价任务
。4.
根据权利要求1所述的一种用于多源空间信息众包式采集的任务激励方法,其特征在于:所述强化学习使用网络为两个隐藏层和一个全连接层构成的
DQN
网络
。5.
根据权利要求1所述的一种用于多源空间信息众包式采集的任务激励方法,其特征在于:还包括采用所述强化学习使用网络调节估价公式中的参数来得出价格,每个区域的任务和采集者的数量比是影响价格的重要因素,估价公式如下所示:其中:
price(t
i
)
为任务的价格,
TW
ratio
(t
i
)
是任务采集者数量比,
λ
为价格缩放因子
。6.
根据权利要求1所述的一种用于多源空间信息众包式采集的任务激励方法,其特征在于:所述
MDP
模型包括:状态:将当前时间众包式采集任务的真实地理位置的经纬度用
lon
i
、lat
i
表示

经纬度经过网格化后的位置坐标用
x
i
、y
i
表示,该任务附近的供需比
TW
ratio
(t
i...

【专利技术属性】
技术研发人员:陈荣张志康汪桐刘言哲温昕彤
申请(专利权)人:大连海事大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1