【技术实现步骤摘要】
Statistical Dynamic Programming)技术方案,根据已知的信道衰落系数的分布估计每个时隙的传输方法;进一步引入Q
‑
learning算法,通过已知的当前信道状态和估计的下一时隙的信道状态,给出相应的传输方法,经验证这一算法相对于ASDP算法来说可以更为接近最优下限。
[0005]为了实现以上目的,本专利技术所采用的技术方案为:
[0006]一种面向延迟容忍服务的高能效传输方法,具体包括以下步骤:
[0007]步骤1、建立单天线点对点通信系统模型;
[0008]步骤2、根据步骤1的通信系统模型建立DT服务能效模型;
[0009]步骤3、将步骤2中的传输功率优化问题转变为马尔可夫决策过程(Markov Decision Process,MDP)问题,引入强化学习算法得到高能效传输方法;利用源节点观测当前信道状态以及对未来时隙信道状态估计调整优化传输功率。
[0010]一种面向延迟容忍服务的高能效传输方法,具体包括以下步骤:
[0011]所述步骤1的具体方法为:
[0012]将两个装备了单天线的通信节点通过时分双工(TDD)的方式进行通信,在通信过程中信号同时受到高斯加性白噪声(Additive White Gauss Noise,AWGN)和乘性衰落的影响,不失一般性;假设节点间的乘性衰落是由于阴影衰落(大尺度衰落与小尺度衰落共同作用)引起的,同时,假设每个时隙内的信道衰落幅度保持不变,因此,第i个时隙中的接收信号可以表示为:
[0013][001 ...
【技术保护点】
【技术特征摘要】
1.一种面向延迟容忍服务的高能效传输方法,其特征在于,具体包括以下步骤:步骤1、建立单天线点对点通信系统模型;步骤2、根据步骤1的通信系统模型建立DT服务能效模型;步骤3、将步骤2中的传输功率优化问题转变为马尔可夫决策过程(Markov Decision Process,MDP)问题,引入强化学习算法得到高能效传输方法;利用源节点观测当前信道状态以及对未来时隙信道状态估计调整优化传输功率。2.根据权利要求1所述的一种面向延迟容忍服务的高能效传输方法,其特征在于,所述步骤1的具体方法为:将两个装备了单天线的通信节点通过时分双工(TDD)的方式进行通信,在通信过程中信号同时受到高斯加性白噪声和乘性衰落的影响,不失一般性;假设节点间的乘性衰落是由于阴影衰落即大尺度衰落与小尺度衰落共同作用引起的,同时,假设每个时隙内的信道衰落幅度保持不变,则第i个时隙中的接收信号可以表示为:其中,P
t,i
是第i个时隙的传输功率,h
i
和z
i
分别为信道衰落系数和Gauss噪声变量,y
i
和x
i
分别表示接收信号和发送信号。3.根据权利要求1所述的一种面向延迟容忍服务的高能效传输方法,其特征在于,所述步骤2的具体方法为:将通信能效表示为:其中,C为信道速率,W为信道带宽,P
l
和P
t
分别为静态功率和传输功率;进一步定义τ为单位时隙的持续时间,则总信息量为φ=CτTW,这里T为时隙个数;同时,总静态功率为P
l总
=WTτP
l
,总动态功率为系统能效最终可以表示为:对于特定业务,包括视频的点播、信息的收发、音乐的播放等,所需传输的总信息量φ为固定值;同时,对无线通信,静态功率WTτP
l
为固定值,将特定业务的能效最大问题可以等效为传输功率最小化问题,进行传输功率优化;将时隙长度τ和带宽W归一化,则通信业务的总信息量φ可表示为:其中:
h
i
表示第i个时隙的信道衰落系数,为第i个时隙Gauss白噪声的方差,i=1,2,3,...,8;同时,源节点的发射功率约束可以表达为:P
t,i
≤P
t,i,max
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)其中,i=1,2,
…
,T;显然,式(7)是一个经典的凸优化问题,提供了DT服务的传输功率下限或能效上界。4.根据权利要求1所述的一种面向延迟容忍服务的高能效传输方法,其特征在于,所述步骤3的具体方法为:3.1)运用SDP传输功率优化算法或ASDP传输功率优化算法对离散信道状态进行DT服务的高能效传输;3.1.1)运用SDP传输功率优化算法对离散信道状态进行DT服务的高能效传输:通信节点传输的信息总量φ可以离散化为而离散信道状态ψ可以表示为其中,N1、N2为预定义的整数;采用MDP四元组<K,M,H,Υ>对DT服务传输过程中的状态、动作、奖励和状态转移概率进行定义;其中,K={κ1,κ2,
…
}是DT服务传输过程的状态集,M={m1,m2,
…
}是DT服务传输过程的动作集,H和Υ分别为动作之后获得的奖励和状态转移概率;其中,状态集K中的状态κ
i
由当前信道状态和通信节点传输的信息量构成,可以表示为:其中,θ
φ
∈{0,1,
…
,N1},θ
C
∈{1,2
…
,N2},i∈{1,
…
,(N1+1)*(N2)};而动作集M中的动作m
j
由通信节点在当前时隙中传输的信息量构成,可表示为:其中,θ
m
∈{0,1,
…
,N1},j={1,2,
…
,N1+1}。状态转移概率Υ和动作之后获得的奖励H与动作m和状态κ有关,则在第t时隙从状态κ转移到状态κ
′
的概率Υ
t
可以表示为:
则高能效传输的MDP问题可以用SDP方程表示为:则高能效传输的MDP问题可以用SDP方程表示为:其中,U
t+1
(κ
i
)为t+1时隙的状态值函数,L
t
(κ
i
,m
j
)分别为t时隙的状态动作值函数;在最后一个时隙中需要将全部信息传输完成,于是在最后一个时隙的状态值函数和状态动作值函数可以表述为:U
t
(κ
i
)=H(κ
i
)L
t
(κ
i
,m
j
)=H(κ
i
,m
j
)
ꢀꢀꢀꢀꢀꢀꢀꢀ
(13)其中,状态动作值函数表示的是为使得累积得到的传输功率最小,在t时隙选择传输的最大信息量;而在实际通信中,状态值函数U
t
(κ
i
)可以通过状态动作值函数L
t
(κ
i
,m
j
)来计算,表示为:U
...
【专利技术属性】
技术研发人员:朱锐,白朦梦,郭建新,王锋,褚鹏,王利平,陈雅蓉,竹杭杰,
申请(专利权)人:西京学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。