一种高可靠的自适应MAC层调度方法技术

技术编号:20925803 阅读:41 留言:0更新日期:2019-04-20 11:44
本发明专利技术公布了一种高可靠的自适应MAC层调度方法。主要解决无线传感器网络中簇头节点由于空闲侦听造成大量能耗的问题。所述方法包括:对无线传感器网络进行模型建立;生成特定帧格式,在帧控制字段中嵌入队列占用率与延时;初始化动作集合,选择概率集合以及回馈集合;协调器利用学习自动机方法与周围环境进行交互,更新其动作与状态;将整个学习过程分为三个阶段:初始阶段、探索阶段和贪婪阶段,采取相应的搜索策略;评估动作与环境交互的作用,更新反馈与选择概率集合;基于反馈集合选取决定占空比的相关参数,实现自适应的MAC层调度。本发明专利技术实施例,保证节点在运行期间内自适应调整占空比,最小化功耗,具有广泛的应用价值。

A Highly Reliable Adaptive MAC Layer Scheduling Method

The invention discloses a highly reliable adaptive MAC layer scheduling method. It mainly solves the problem of energy consumption caused by idle interception of cluster head nodes in wireless sensor networks. The methods include: modeling wireless sensor networks; generating specific frame formats and embedding queue occupancy and delay in the frame control field; initializing action sets, selecting probability sets and feedback sets; coordinator using learning automata method to interact with the surrounding environment, updating its action and state; and dividing the whole learning process into three stages: initial stage In the stage of exploration and greed, the corresponding search strategy is adopted; the interaction between action and environment is evaluated, and the feedback and selection probability sets are updated; the relevant parameters determining duty cycle are selected based on the feedback sets to realize adaptive MAC layer scheduling. The embodiment of the present invention ensures that the node adaptively adjusts the duty cycle and minimizes power consumption during operation, and has wide application value.

【技术实现步骤摘要】
一种高可靠的自适应MAC层调度方法
本专利技术属于无线传感器网络
,特别涉及一种高可靠的自适应MAC层调度方法。
技术介绍
无线传感器网络(WSN)节点通常是电池供电的,并且在许多部署环境中,更换电池或电磁充电都是昂贵的,甚至不可行的。因此,低功耗被认为是无线传感器网络通信协议的最重要指标。具体来说,节点不知道其他节点何时发生数据,故节点即使在空闲状态下,收发器也将持续处于接收模式。空闲侦听被认为是能源浪费的主要问题之一。目前,最广泛被采用的IEEE802.15.4标准定义了几种不同类型的节点:全功能设备(FFD)也称为启用信标的设备,可以作为个人区域网络协调器,簇头或路由器运行,部分功能设备(RFD)也称为非信标设备,只能作为终端设备运行。在FFD充当簇头时,由于FFD无法预测其他传感器节点何时将其数据发送给它们,因此它们需要始终处于接收模式以接收所有收集到的信息,这样会迅速耗尽其能量。为了克服这个问题,标准规范定义了启用信标的模式。此模式支持信标帧从协调器传输到允许节点同步的终端设备。这样使得所有设备在协调传输之间进行休眠,有助于减少空闲侦听,从而延长网络寿命。近年来,针对这种情况,提出了许多占空比调节算法,例如修改MAC帧头中存在的保留帧控制字段,收集节点的发送队列占用以及端到端延迟等信息来选择占空比;还有一种方案采用强化学习的方式,其主要目标是找到最佳的占空比,设计了一种在WSN环境中调整SMAC协议睡眠时间的方案,所提出的方案是以排队等待发送的帧数作为状态,以保留的活动时间为动作。然而,这意味需要存储大量的状态-动作对,在内存资源受限的无线传感器节点中是不可取的。最近有提出基于标准CAP结束时设备发出的忙音的CAP的扩展。仅当设备发送其所有数据帧失败时才发送忙音。如果在CAP结束时任何设备的传输队列中存在一些实时数据,则扩展CAP。然而,这些扩展不符合标准,需要修改超帧结构。
技术实现思路
本专利技术实施例提供一种高可靠的自适应MAC层调度方法,在运行期间内自适应调整占空比,不需要人为干预,以便最小化功耗,同时平衡成功的数据传递的概率和应用的延迟约束。为达到上述目的,本专利技术实施例提供了一种高可靠的自适应MAC层调度方法,应用于无线传感器网络中的协调器设备上,方法包括:根据无线传感器网络环境进行模型建立,无线传感器网络环境模型由三维数组E=(α,β,p)表示,其中α表示节点自动学习即输入的动作集,在本专利技术中表示节点的占空比集合;β表示节点选择合适的占空比之后与环境交互输出的反馈信号。具体的,根据β取值类型的不同可以将环境分为P-模型和Q-模型:在P-模型中,反馈信号为布尔值(0或1);在Q-模型中,反馈信号为[0,1]内连续的随机变量。P-模型由于其控制模型简单易用,故本专利技术采用P-模型。p={p1,p2,...,pr}表示一系列奖惩概率,并且每一个学习自动机动作αi都有一个相应的pi。节点生成特定帧结构格式,利用帧控制字段的保留位嵌入队列占用率与排队延时等参数。具体的,为了避免引入任何额外的开销,每个终端设备在发送的每个数据帧的帧控制结构中嵌入队列占用率O和排队延迟D,该信息使用如图3所示的帧控制字段的3个保留位来嵌入。需要说明的是,每个发送者使用两个比特来表示4个不同级别的队列占用率oi,而排队延迟di被划分为2个级别。协调器(FFD)进行流量估算,生成一个流量自适应的占空比集合。需要说明的是,本专利技术假设无线传感器网络为星型拓扑结构,协调器收集终端设备发送的数据。每个协调器通过计算终端设备发送队列中的空闲监听、分组累积和延迟来估计传入业务。为协调器初始化其动作集合,动作选择概率集合以及回馈集合。具体的,学习自动机是一个基于概率的学习工具,它通过随机活动概率向量Pi(t)来选择活动,活动概率向量是学习自动机的主要构件,所以必须保持随时更新。需要说明的是,在初始阶段,为防止无线传感器网络数据流量很大的情况下丢失大量数据的情况发生,将其动作选定为占空比最大,即协调器始终处于接受状态,而其对应的动作选择概率也为1,保证前期协调器能够收集到网络的更多信息。协调器(FFD)使用学习自动机方法(LA)方法与周围环境进行交互。具体的,可变结构的学习自动机模型可以由三维数组LA=(α,β,p)表示,其中,α={α1,α2,...,αr}表示学习自动机的动作集,β={β1,β2,...,βr}表示环境给予的反馈信号集,p={p1,p2,...,pr}表示动作概率集,满足其中pi(n)表示经过第n轮学习过程的αi对应的动作概率。选择探索策略:不同时期选择不一样的探索策略具体而言,将整个部分的探索策略分为3个阶段:初始阶段,探索阶段和贪婪阶段;初始阶段,采用循环搜索策略以确定性方式探索集合中的所有动作,节点在初始时选择最高的占空比,慢慢减小占空比直至最小占空比,这样确保了所有的占空比集合都被尝试。探索阶段,随机地探索比当前选择更高的占空比的动作,如果选择概率增加了说明奖励增加了。否则,如果奖励保持不变或者下降,它会随机地探索低的占空比行动。贪婪阶段,当应用探索策略进行学习一段时间之后,节点对环境的认知就基本差不多了,这是可以开始自主选择动作。评估该动作与环境交互后对数据传输的影响,更新反馈集合,更新动作选择概率集合具体的,协调器通过使用在最后一个活动持续时间内从发送者接收到的反馈更新每个信标间隔的奖励。选择动作,基于反馈集合选择决定占空比的BO和SO标准参数,实现自适应的MAC调度在选择动作值之后,调整决定占空比的BO和SO标准参数。为达到上述目的,本专利技术实施例提供了一种高可靠的自适应MAC层调度装置,应用于无线传感器网络中的协调器设备,所述装置包括:生成单元:生成特定的帧控制结构格式,在帧控制字段的保留位嵌入队列占用率和排队延时等参数;发送单元:各个传感器节点根据自身的情况设置生成的帧格式,发送给各个传感器节点;接收单元:用于接收各个传感器节点在接入信道后发送的数据帧;所述数据帧至少包括队列占用率和排队延时等参数;评估单元:根据传感器节点发送的参数以及协调的工作状态评估该动作的选择概率;自主学习单元:节点采用学习自动机方法更新自身的动作集合,动作选择概率集合以及反馈集合;策略选择单元:判断处于哪个时隙,采取相应的策略,在初期阶段采取循环探索策略,在探索阶段采取随机策略,在最后的贪婪阶段采取贪心策略;自适应调节单元:选择动作之后,基于反馈集以及动作集调整参数BO与SO,完成自适应的MAC调度。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种高可靠的自适应MAC层调度方法的流程示意图;图2为本专利技术实施例提供的学习自动机的模型示意图;图3位本专利技术实施例提供的帧控制格式的结构示意图;图4为本专利技术实施例提供的一种高可靠的自适应MAC层调度装置的结构示意图;图5为本专利技术实施例提供的MAC层调度节点传输碰撞示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技本文档来自技高网
...

【技术保护点】
1.一种高可靠的自适应MAC层调度方法,其特征在于,包括以下步骤:第一步,根据无线传感器网络环境进行模型建立,将学习自动机方法应用到无线传感器网络的环境之中,将传感器网络环境模型用三位数组E=(α,β,p)表示,其中α={α1,α2,....,αn}表示节点的占空比集合,β={β1,β2,...,βm}表示节点与环境交互输出的反馈信号,p={p1,p2,....,pn}表示一系列奖惩概率;第二步,节点生成特定帧结构格式,利用帧控制字段的保留位嵌入队列占用率与排队延时等参数。具体的,每个终端设备在发送的每个数据帧的帧控制结构中嵌入队列占用率O和排队延迟D,该信息使用如图3所示的帧控制字段的3个保留位来嵌入;第三步,协调器(FFD)进行流量估算,生成一个流量自适应的占空比集合,每个协调器通过计算终端设备发送队列中的空闲监听、分组累积和延迟来估计传入业务;第四步,为协调初始化其动作集合,动作选择概率集合以及回馈集合;第五步,协调器(FFD)使用学习自动机方法(LA)方法与周围环境进行交互,采用P‑环境模型,反馈信号取值为0或‑1,若反馈信号取0时,概率定义如下:

【技术特征摘要】
1.一种高可靠的自适应MAC层调度方法,其特征在于,包括以下步骤:第一步,根据无线传感器网络环境进行模型建立,将学习自动机方法应用到无线传感器网络的环境之中,将传感器网络环境模型用三位数组E=(α,β,p)表示,其中α={α1,α2,....,αn}表示节点的占空比集合,β={β1,β2,...,βm}表示节点与环境交互输出的反馈信号,p={p1,p2,....,pn}表示一系列奖惩概率;第二步,节点生成特定帧结构格式,利用帧控制字段的保留位嵌入队列占用率与排队延时等参数。具体的,每个终端设备在发送的每个数据帧的帧控制结构中嵌入队列占用率O和排队延迟D,该信息使用如图3所示的帧控制字段的3个保留位来嵌入;第三步,协调器(FFD)进行流量估算,生成一个流量自适应的占空比集合,每个协调器通过计算终端设备发送队列中的空闲监听、分组累积和延迟来估计传入业务;第四步,为协调初始化其动作集合,动作选择概率集合以及回馈集合;第五步,协调器(FFD)使用学习自动机方法(LA)方法与周围环境进行交互,采用P-环境模型,反馈信号取值为0或-1,若反馈信号取0时,概率定义如下:若反馈信号取-1时,概率定义如下:第六步,选择探索策略:不同时期选择不一样的探索策略,将整个学习过程分成三个阶段,初始阶段采用循环搜索策略,探索阶段采用随机搜索策略,贪婪阶段则采用贪心策略;第七步,评估该动作与环境交互后对数据传输的影响,更新反馈集合,更新动作选择概率集合;第八步,选择动作,即基于反馈集合选择决定占空比的BO和SO标准参数,选择最优的占空比,其中,BO参数定义如下:BO=max(4,|A|→(BI-SD)<δ)(3)2.根据权利要求1所述的一种高可靠的自适应MAC层调度方法,其特征在于,所述的网络环境模型建立,具体是,无线传感器网络环境模型由三维数组E=(α,β,p)表示,其中α={α1,α2,....,αn}表示节点自动学习即输入的有限动作集,在本发明中表示节点的占空比集合;β={β1,β2,...,βm}表示节点选择合适的占空比之后与环境交互输出的反馈信号,p={p1,p2,....,pn}表示一系列奖惩概率,每个惩罚概率pi都和给定的输入变量αi有关。根据反馈信号β,可以将环境划分为P型环境,Q型环境,S型环境3种类型。本发明采用P-模型对无线传感器网络环境进行模型建立,反馈信号为布尔值(0或1),即β仅用二进制的0和1描述。其中,αi(αi∈α)表示学习自动机选择的活动,p(t)表示在t时刻的概率向量,用Preward表示奖励因子,用Ppenalty表示惩罚因子,用这两个因子分别来确定增加或者减少活动的概率,概率向量P(t)更新定义如下:如果活动被随机环境奖励,则其活动概率向量P(t)更新定义如下:3.根据权利要求1所述的一种高可靠的自适应MAC层调度方法,其特征在于,节点生成特定帧结构格式,具体的是,每个终端设备在发送的每个数据帧的帧控制结构中嵌入队列占用率O和排队延迟D,该信息使用如图3所示的帧控制字段的3个保留位来嵌入。具体的,每个发送节点使用两个比特来表示4个不同级别的队列占用率oi,而排队延迟di被划分为2个级别。通过这个信息,协调器可以估计队列占用率O和排队延迟D。队列占用率O定义如下:需要说明的是,通过3个保留位的信息,协调器可以估计队列占用率O和排队延迟D,如果存在节点设备达到或超过可以存储在其队列中的最大帧数,则等于1。否则,它等于表示在分组累积的CAP中接收到的第一消息的平均排队占用,即非活动时段期间队列占用率最高的时间。需要说明的是,每个终端设备i的排队延时位Di表示当前信标间隔BI与定义的延时阈值Dth最小值的一个比较,如果小于该最小值,则排队延时位Di为′0′,否则为′1′。协调器将延迟标志为节点设备发送的最大延迟。这样做是为了保证任何节点在排队延迟高于阈值时仍然可以进行数据传输。4.根据权利要求1所述的一种高可靠的自适应MAC层调度方法,其特征在于,协调器(FFD)进行流量估算,具体是每个协调器通过计算终端设备发送队列中的空闲监听、分组累积和延迟来估计传入业务。空闲监听IL的表达式如下:IL=1.0-SFu(7)其中,SFu表示超帧利用率,是终端设备占用超帧的时间与可用于数据通信的总时间之间的比例,定义为:其中,SD为超帧持续时间,Tb协调器为信标传输花费的时间,Tc表示由于帧冲突而设备占用信道的时间,Tr是用于数据接收的时间,Ts定义如下:Ts=TCCA+TDATA+TIFS+TACK(9)其中,TCCA表示每一帧数据发送过程中的信道评估时间,TDATA表示数据传输时间,TIFS表示帧间间隔,TACK表示确认接收时间。5.根据权利要...

【专利技术属性】
技术研发人员:刘元安张洪光王怡浩范文浩吴帆谢刚
申请(专利权)人:北京邮电大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1