一种基于合作博弈及深度学习的节点协作缓存方法技术

技术编号:37150438 阅读:31 留言:0更新日期:2023-04-06 22:05
本发明专利技术公开一种基于合作博弈(CG)及深度学习(DL)的节点协作缓存方法。在节点协作缓存机制中,考虑到网络中的节点缓存空间有限,解决如何让每个用户节点在有限的缓存空间下获取更多网络内容的同时最大化联盟整体利益的问题。将节点协作缓存问题建模成CG,并分析节点在效用可转移(TU)和效用不可转移(NTU)两种情况下是否达成联盟合作的问题。在TU的情况下,推导联盟的核心非空的性质,并提出节点之间确保形成大联盟的条件。在NTU且联盟成本存在时,提出一种联盟形成算法,找出能够最大化整体效益的联盟。仿真结果表明,提出的联盟形成算法能收敛于纳什稳定最优解或者渐进最优解,在与遍历算法性能几乎一致的情况下,复杂度远低于遍历算法。度远低于遍历算法。度远低于遍历算法。

【技术实现步骤摘要】
一种基于合作博弈及深度学习的节点协作缓存方法


[0001]本专利技术涉及无线网络通信
,具体涉及一种基于合作博弈(CG)及深度学习(DL)的节点间协作缓存方法,主要目的是提高联盟系统的整体性能、降低系统复杂度。

技术介绍

[0002]在当前快速发展的信息时代,由于移动设备和移动应用的爆炸式发展,无线网络资源需求快速增长,用户节点所需求的内容也逐渐丰富多样。但是用户节点的缓存空间有限,每个用户节点在同一时间下不能加载过多的内容。导致缓存空间有限的用户节点与其日益增长的网络资源需求之间存在着紧张关系。过去,人们通过传统蜂窝网络满足用户内容需求的方式已不适用,因此设备到设备(D2D)通信作为一种关键技术被提出,其技术特性能够满足用户间直接通信,提高系统整体性能。考虑到当前移动终端具有缓存功能,基于D2D通信的节点间内容共享可以有效扩展网络容量,同时降低服务时延。一些研究人员提出了一种组合缓存方案,由中央控制器安排集群内的整体缓存空间,一部分缓存空间保留流行度高的内容,一部分用来协作内容流行度低的分区,再采用联合传输或并行传输的多点协作技术将内容本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于合作博弈(CG)及深度学习(DL)的节点协作缓存方法,其特征在于,该方法针对一个无线网络中包含N个随机分布的节点,移动用户节点表示为集合N={1,...,N};对所述无线网络的N个移动用户节点进行协作缓存的方法,具体包括以下步骤:1)定义无线网络中节点可以载入的不同网络资源内容有d个,构成集合D={1,

,d};每个节点i对不同的网络资源d∈D的感兴趣度表示为I
i
=(I
i,1
,I
i,2
,

,I
i,d
),I
i,d
∈(0,1),表示节点i对内容的需求程度,定义Q
I
为所有节点对内容的感兴趣度,是一个N维d列的矩阵;2)每个节点根据自身的缓存空间m
i
和对网络中内容的感兴趣度I
i
缓存自己最感兴趣的内容,形成缓存策略K
i
,K
i
=(k
i,1
,k
i,2
,...,k
i,d
),k
i,d
∈{0,1}表示节点i是否缓存了内容d;N个节点的缓存策略构成矩阵K;3)节点之间可以形成联盟来共享彼此缓存的网络资源;节点i的缓存策略为K
i
=(k
i,1
,k
i,2
,...,k
i,d
),节点j的缓存策略为K
j
=(k
j,1
,k
j,2
,

,k
j,d
);如果节点i和节点j之间组成联盟Z,它们互相向对方发送内容请求,请求的内容是自身较为感兴趣但是由于缓存空间有限未进行下载的;对于网络内容d,联盟Z中所有节点对其缓存策略定义为k
Z,d
计算如公式2:k
Z,d
越大表示联盟Z中成员节点能更容易获得网络资源d,用向量K(Z)=(k
Z,1
,k
Z,2
,

,k
Z,d
)表示联盟Z
n
内所有节点对所有内容的缓存策略的集合;4)节点载入网络资源所获得的收益的计算公式为4)节点载入网络资源所获得的收益的计算公式为4)节点载入网络资源所获得的收益的计算公式为是节点i在联盟Z中能够从自身或者其他节点获得网络资源的收益;h
i,d
为二进制状态变量,当缓存策略不为0时,h
i,d
=1代表联盟Z可以对内容d发出请求,并通过节点间共享资源,载入此内容;5)在联盟Z中,假定某一内容在联盟中被请求,前提是此内容在联盟中已经有节点下载,那么下载此内容的所有节点都会响应该请求,届时会产生一个能量消耗;令c
i,d
表示节点相应内容请求向其他节点传输网络资源的能量消耗,节点i的能量消耗计算公式为
其中,是节点需要作为信息提供者向其他邻居节点发送网络资源所消耗的能量;结合公式3和公式5,计算联盟Z中节点i的效用u
i
(Z),表示为6)系统整体效用函数表示为节点间如何合作,集合N的哪种联盟能够使系统整体效用U
N
达到最优即对应最优的缓存策略;7)采用联盟博弈理论讨论集合N的划分,合作博弈根据节点间效用是否可转移分为两类:TU博弈和NTU博弈;8)首先在TU/NTU博弈下构建优化问题,具体方法为:节点在合作博弈过程中,联盟动态更新;定义υ(V
bet
)为形成稳定联盟后联盟整体效用,找到最佳的稳定联盟即最大化整体效用;将此优化问题构建为将此优化问题构建为将此优化问题构建为V
bet
是找到联盟整体效用最优或者渐进最优的稳定联盟集合;其中,稳定联盟集合里面任意两个子联盟V
k
,V
k'
之间不存在共同的节点,且每个节点缓存的内容长度不超过本身的缓存空间;9)TU博弈下,所有节点形成一个大联盟;联盟需满足下面的条件:υ(Z∪{i})

υ(Z)≤υ(Y∪{i})

υ(Y)(11)其中,Z,Y为两个子联盟,且子联盟Z包含于子联盟Y;当联盟成本存在时,其需满足以下条件:
定义Δv
Z
(i)是节点i加入联盟Z后带来的边界效用,考虑到联盟成本,节点i的边界效用为其中,是加入联盟后新增的缓存策略;当子联盟Y比子联盟Z有更大的缓存空间;如果满足联盟成本节点i带来的边界效用满足非减的条件;那么公式υ(Z∪{i})

υ(Z)≤υ(Y∪{i})

υ(Y)成立;10)提出一种联盟形成算法并将其与深度强化学习算法DRL中的深度Q学习网络DQN算法进行结合,使节点间形成稳定的联盟后最终收敛于纳什稳定最优解或者渐进最优解;10.1)定义深度强化学习算法中的马尔可夫决策过程MDP:将一个MDP过程记为五元组{S,A,P,R,Done};其中S和A分别是状态空间集合和代理人的动...

【专利技术属性】
技术研发人员:金宁周文倩
申请(专利权)人:中国计量大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1