【技术实现步骤摘要】
一种基于用户偏好预测的异构网络缓存决策方法
本专利技术属于无线通信技术,具体涉及一种基于用户偏好预测的异构网络缓存决策方法。
技术介绍
随着移动互联网的发展,无线移动设备急剧增长,产生了大量的数据流量,给移动通信带来了挑战,在本地缓存流行的文件便是应对这些挑战的解决方案之一。5G异构网络通过部署小基站来卸载宏基站的流量负荷,但是小基站的回程线路成为系统性能的瓶颈。缓存技术通过预先在部分用户和小基站中缓存流行的文件,当用户需要这些文件时,可以通过小基站或D2D通信来获得这些文件,而不用占用小基站的回程链路和宏基站的带宽,在流量高峰期避免了网络的拥塞,同时也可以降低时延,从而提升了QoS。但是,考虑到缓存成本的限制,小基站部署的缓存设备容量有限,而移动设备的存储容量更小,远远小于互联网内容库的容量,因此制定正确的缓存决策来确定缓存中放置的文件,对提高缓存命中率是非常重要的。
技术实现思路
专利技术目的:为了克服现有技术中存在的不足,本专利技术提供一种基于用户偏好预测的异构网络缓存决策方法。为实现上述目的,本专利技术所提供的技术方案如下:一种基于用户偏好预测的异构网络缓存决策方法,所述方法中宏基站、小基站和D2D的通信方式并存,包括如下步骤:(S1)首先在用户请求不同文件的概率分布未知的情况下,通过机器学习根据其请求历史记录预测用户偏好;(S2)基于用户的移动性、物理位置关系、社会关系推导平均系统成本的表达式,在缓存容量的约束下,以小基站和重要用户的缓存策略为变量 ...
【技术保护点】
1.一种基于用户偏好预测的异构网络缓存决策方法,其特征在于:所述方法中宏基站、小基站和D2D的通信方式并存,包括如下步骤:/n(S1)首先在用户请求不同文件的概率分布未知的情况下,通过机器学习根据用户请求历史记录预测用户偏好;/n(S2)基于用户的移动性、物理位置关系、社会关系推导平均系统成本的表达式,在缓存容量的约束下,以小基站和重要用户的缓存策略为变量,构建平均系统成本最小化的优化问题,通过求解该问题进行缓存决策;/n(S3)基于贪心算法的次优算法对平均系统成本最小化的优化问题进行求解,按照解向量决定予以缓存的文件。/n
【技术特征摘要】
1.一种基于用户偏好预测的异构网络缓存决策方法,其特征在于:所述方法中宏基站、小基站和D2D的通信方式并存,包括如下步骤:
(S1)首先在用户请求不同文件的概率分布未知的情况下,通过机器学习根据用户请求历史记录预测用户偏好;
(S2)基于用户的移动性、物理位置关系、社会关系推导平均系统成本的表达式,在缓存容量的约束下,以小基站和重要用户的缓存策略为变量,构建平均系统成本最小化的优化问题,通过求解该问题进行缓存决策;
(S3)基于贪心算法的次优算法对平均系统成本最小化的优化问题进行求解,按照解向量决定予以缓存的文件。
2.根据权利要求1所述的基于用户偏好预测的异构网络缓存决策方法,其特征在于:所述方法的算法处理过程具体如下:
(1)用S={1,...,S}、U={1,2,...,U}、C={1,...,C}和F={1,...,C*Fc}分别表示小基站集、用户集、文件类别集和文件集,其中S、U、C、Fc分别表示小基站数、用户数、文件类别数和每类文件数,用tmin、tmin′分别表示通过D2D和通过小基站下载每个文件需要最小通信时间,宏基站包含内容库中的全部文件;
(2)将时间划分为等长的时隙,t∈N表示第t个时隙,其起始时刻是τt,所有时隙长度都为T,每个时隙开始,即当前时隙的用户初始D2D连接情况其中指示函数代表用户i和用户j在t时隙开始是否能够进行D2D通信,用“1”或“0”表示;然后每个用户按照其偏好随机的请求文件,构成文件请求向量Rt={rit:i=1,...,U},其中rit∈F是用户i在t时隙请求的文件;
(3)通过指示变量表示用户间的物理关系,如果用户i和用户j在t时刻具有物理关系,则若没有则定义μi,j表示用户i与用户j间连接时长服从的指数分布的参数,用λi,j表示用户i与用户j间隔时长服从的指数分布参数,根据用户i和用户j在t0时刻的连接情况计算用户i和用户j在tc时刻相连的概率
(4)定义μ′u,s和λ′u,s表示用户u和小基站s间的连接时长和间隔时长分别服从的指数分布的参数,指示变量表示用户u和小基站s间的物理关系,根据t0时刻的连接情况计算用户u和小基站s在tc时刻相连的概率
(5)定义Si,j表示用户i与用户j之间的社会关系,用ST表示社会关系阈值,基于Si,j和ST计算用户间的社会联系si,j,用θu表示用户u的社会重要性,用来衡量用户的社会重要程度,计算每个用户的社会重要性θu=α·Vu+β·Bu,其中Vu,Bu分别代表用户u的设备容量和中介中心性,α,β是权重系数,且满足α+β=1,依据社会重要性选取重要用户来缓存文件;
(6)构建H={H1,H2,...,HU}表示决策时刻前Tb个时隙的历史文件请求其中代表用户u的请求历史,为前Tb个时隙中第tb个时隙时请求的文件,根据历史文件请求H计算出基于次数的用户对每类文件的经验概率分布,并用表示用户u请求第ci类文件的概率,并作为K-means算法的数据集;
(7)计算不同K值下所有数据点到其聚类中心点的距离之和作为衡量当前K-means模型的性能度量,计算表达式如下:
其中X为数据点向量,Mi代表第i类的聚类中心,距离采用欧式距离;
(8)计算Gap(K)=E(logDK)-logDK作为GapStatistic,其中E(logDK)为logDK的期望,选取使Gap(K)最大的K值optK作为用户分类的类别数;
(9)针对每一类用户,计算其聚类中心作为该类用户请求该类文件的经验概率分布,将聚类中心从大到小排序,并获得对应的索引向量,按照排序取值和排名取对数后作为y,x数据进行线性回归求得Zipf分布参数s;
(10)计算该类用户请求每类文件的概率,其计算表达式如下所示:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。