当前位置: 首页 > 专利查询>厦门大学专利>正文

一种基于移动群智感知的路况信息汇集方法技术

技术编号:11581664 阅读:129 留言:0更新日期:2015-06-10 15:01
一种基于移动群智感知的路况信息汇集方法,涉及无线通信技术与智能交通技术领域。服务器向相关地区的手机用户广播征集路况报告的通知;服务器接收到手机用户的路况报告后,按照路况报告的精确度对其划分等级;服务器汇总所有接收到的路况报告后,确定服务器在此刻的状态s,获得系统增益G(s);在目标最优定价不确定的情况下,服务器通过Q学习,学习如何对手机用户的任务路况报告的奖励金额定价,以获取服务器的最大收益;对不同质量等级l的路况报告有不同的定价y(l),在一次学习过程中规定服务器的最大任务发布次数为K,第k次任务发布中的服务器状态是sk,服务器对路况报告的总定价是yk。

【技术实现步骤摘要】

本专利技术涉及无线通信技术与智能交通
,尤其是涉及一种基于移动群智感 知的路况信息汇集方法。
技术介绍
安全城市的建设依赖于出行的安全问题,如何获取实时的路况信息成为问题的关 键所在。以往的GPS定位检测方法费用较高,准确度偏低,很难满足人们的需求。智能手机 和网络发展则让实时精准路况信息的共享得以实现,特别是社交平台的应用让人们的信息 交互更为方便。当有事故比如车祸、火灾发生时,手机用户通过网络将路况信息和自身的位 置信息上传到服务器。这些路况信息可以帮助服务器了解城市的事故分布,并迅速做出应 对措施。相比于通过卫星监控城市有无异常状况的方法来说,这种方法的准确度会大大提 升,成本也会降低。但是,如何才能激励手机用户发送路况信息到服务器上是重中之重。考 虑到用户的自私性,手机用户不会毫无回报的主动将真实的路况信息上传到服务器。如果 无法获取大量手机用户的数据,服务器就无法得到完整有效的城市路况信息。所以服务器 需要通过一定的激励机制来推动普通手机用户参与到该系统的构建中来,如何定价报酬才 能吸引更多的手机用户并且使服务器获得最大效益是我们需要做的。然而,在服务器对外 界传输消耗和手机用户信息并不明确的情况下,需要不断调整定价,来学习如何定价才能 达到以上目标。Q学习是一种强化学习,它可以不断与外界交互来得到反馈,从而得到自身 收益最大化的行为。 中国专利CN103310349公开一种基于在线激励机制的感知数据获取方法,它采 用公开拍卖的机制根据手机用户的竞价和对系统的效益贡献来选取是否采纳手机用户的 竞标方案,手机用户在收到系统采纳的决定后执行任务将数据发送到感知系统;中国专利 CN103870990公开一种移动群智感知系统中覆盖问题的激励机制实现方法,它同样采用公 开拍卖机制来选取手机用户竞标方案,但它是报酬支出有限制的逆向拍卖系统,而且它的 感知任务分配带有地理位置信息限制覆盖的问题。上述两项专利技术中都是采用拍卖机制,选 取手机用户后手机用户将感知数据发送到服务器,然而手机用户很有可能会发送虚假信息 以降低自身损耗。
技术实现思路
本专利技术的目的是提供。本专利技术包括以下步骤: 步骤1 :服务器向相关地区的手机用户广播征集路况报告的通知,包括手机用户 的地理位置信息、周边路况信息、对路况报告的定价范围P; 步骤2 :服务器接收到手机用户的路况报告X后,按照路况报告X的精确度对其划 分等级,服务器规定路况报告的质量等级表为:,其中L表示路况报告质量的 最高等级,依照质量等级表,将路况报告X的等级定为1 (-1 <I<L),即X= 1 ; 步骤3:服务器汇总所有接收到的路况报告后,确定服务器在此刻的状态s,获 得系统增益G(S) =G(S) =J^iCKx,),其中M是发送路况报告的用户总数,s是服务器接 收到的总体的路况报告质量,G(Xp是手机用户j的路况报告&带给服务器的效益值,不 同等级的路况报告带给服务器的效益是不同的,规定不同等级的路况报告的效益表为: ;与此对应,服务器根据路况报告的不同等级给予不同的支付价 格y,规定不同等级的路况报告的定价表为:,服务器的即时收益 Us(s,y)是系统增益和服务器对手机用户的支付之差,即t/,(s,y) =G(s) -|y(/); 步骤4 :在目标最优定价不确定的情况下,服务器通过Q学习,学习如何对手机用 户的任务路况报告的奖励金额定价,以获取服务器的最大收益;对不同质量等级1的路况 报告有不同的定价y(1),在一次学习过程中规定服务器的最大任务发布次数为K,第k次任 务发布中的服务器状态是sk,服务器对路况报告的总定价是/,其中Q学习包括以下步骤: (1)初始化Q值矩阵:对于每一次任务发布中的服务器每一个可用状态Sk下,对 服务器的所有可选择的定价分配一个对应的Q值,对每个初始Q值赋值为〇,设置学习因子 a(〇 <a< 1)和折扣因子S(〇 <S< 1); ⑵在第k次任务发布中,服务器根据状态Sk从定价范围P内选择yk(l)作为对 质量等级1的路况报告的定价,根据公式:【主权项】1. ,其特征在于包括以下步骤: 步骤1:服务器向相关地区的手机用户广播征集路况报告的通知,包括手机用户的地 理位置信息、周边路况信息、对路况报告的定价范围P; 步骤2 :服务器接收到手机用户的路况报告x后,按照路况报告x的精确度对其划分等 级,服务器规定路况报告的质量等级表为:,其中L表示路况报告质量的最高 等级,依照质量等级表,将路况报告x的等级定为1 (-1 < 1 <L),即x= 1 ; 步骤3 :服务器汇总所有接收到的路况报告后,确定服务器在此刻的状态s,获得系 统增益G(s)|其中M是发送路况报告的用户总数,s是服务器接收 到的总体的路况报告质量,G(Xp是手机用户j的路况报告&带给服务器的效益值,不 同等级的路况报告带给服务器的效益是不同的,规定不同等级的路况报告的效益表为: ;与此对应,服务器根据路况报告的不同等级给予不同的支付价 格y,规定不同等级的路况报告的定价表为:,服务器的即时收益 Us(s,y)是系统增益和服务器对手机用户的支付之差,即步骤4 :在目标最优定价不确定的情况下,服务器通过Q学习,学习如何对手机用户的 任务路况报告的奖励金额定价,以获取服务器的最大收益;对不同质量等级1的路况报告 有不同的定价y(1),在一次学习过程中规定服务器的最大任务发布次数为K,第k次任务发 布中的服务器状态是sk,服务器对路况报告的总定价是/,其中Q学习包括以下步骤: (1) 初始化Q值矩阵:对于每一次任务发布中的服务器每一个可用状态sk下,对服务 器的所有可选择的定价分配一个对应的Q值,对每个初始Q值赋值为〇,设置学习因子a(0 <a< 1)和折扣因子S(〇 <S< 1); (2) 在第k次任务发布中,服务器根据状态sk从定价范围P内选择yk(l)作为对质量 等级1的路况报告的定价,根据公式:对Q值矩阵更新,Q(sk,yk(l))是服务器在sk状态下采用yk(l)值为定价时的Q值,max@sk、y(l))是服务器在sk+1状态下,采用让Q值最大化的定价y(l); (3) 重复步骤(2),直到第n次的任务发布后满)_〇1时,定价y(l) 收敛,yn(l)即是服务器最优定价,其中n<K;(4) 服务器将报酬yn(l)发送给路况报告等级为1手机用户。2. 如权利要求1所述,其特征在于在步骤 1中,手机用户发送的路况报告x中的地理位置信息是手机用户当前的GPS位置信息,路 况信息是对手机用户周围事故的描述;若无事故发生,手机则发送安全确认信息到服务器; 若有事故发生,则发送事故的详细信息到服务器;所述定价范围P是根据市场经验定价,P 会选取高出以往市场定价的最大值;手机用户根据定价范围选择发送路况报告,或者选择 忽略服务器的广播。3. 如权利要求1所述,其特征在于在步骤 2中,服务器对手机用户发送的路况报告评估时,若手机用户发送虚假路况信息,则服务器 对其路况报告等级评估为-1 ;若发送安全确认信息,则服务器对其路况报告等级评估为等 本文档来自技高网
...

【技术保护点】
一种基于移动群智感知的路况信息汇集方法,其特征在于包括以下步骤:步骤1:服务器向相关地区的手机用户广播征集路况报告的通知,包括手机用户的地理位置信息、周边路况信息、对路况报告的定价范围P;步骤2:服务器接收到手机用户的路况报告x后,按照路况报告x的精确度对其划分等级,服务器规定路况报告的质量等级表为:[‑1,0,…,L],其中L表示路况报告质量的最高等级,依照质量等级表,将路况报告x的等级定为l(‑1≤l≤L),即x=l;步骤3:服务器汇总所有接收到的路况报告后,确定服务器在此刻的状态s,获得系统增益G(s):其中M是发送路况报告的用户总数,s是服务器接收到的总体的路况报告质量,G(xj)是手机用户j的路况报告xj带给服务器的效益值,不同等级的路况报告带给服务器的效益是不同的,规定不同等级的路况报告的效益表为:[G(‑1),G(0),…,G(L)];与此对应,服务器根据路况报告的不同等级给予不同的支付价格y,规定不同等级的路况报告的定价表为:[y(‑1),y(0),…,y(L)],服务器的即时收益Us(s,y)是系统增益和服务器对手机用户的支付之差,即步骤4:在目标最优定价不确定的情况下,服务器通过Q学习,学习如何对手机用户的任务路况报告的奖励金额定价,以获取服务器的最大收益;对不同质量等级l的路况报告有不同的定价y(l),在一次学习过程中规定服务器的最大任务发布次数为K,第k次任务发布中的服务器状态是sk,服务器对路况报告的总定价是yk,其中Q学习包括以下步骤:(1)初始化Q值矩阵:对于每一次任务发布中的服务器每一个可用状态sk下,对服务器的所有可选择的定价分配一个对应的Q值,对每个初始Q值赋值为0,设置学习因子α(0<α<1)和折扣因子δ(0<δ<1);(2)在第k次任务发布中,服务器根据状态sk从定价范围P内选择yk(l)作为对质量等级l的路况报告的定价,根据公式:Q(sk,yk(k))=(1-α)Q(sk,yk(l))+α(Us(sk,yk(l))+δmaxy∈PQ(sk+1,y(l)))]]>对Q值矩阵更新,Q(sk,yk(l))是服务器在sk状态下采用yk(l)值为定价时的Q值,y(l))是服务器在sk+1状态下,采用让Q值最大化的定价y(l);(3)重复步骤(2),直到第n次的任务发布后满足时,定价y(l)收敛,yn(l)即是服务器最优定价,其中n≤K;(4)服务器将报酬yn(l)发送给路况报告等级为l手机用户。...

【技术特征摘要】

【专利技术属性】
技术研发人员:肖亮李炎达刘金亮李燕
申请(专利权)人:厦门大学
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1