一种基于用户偏好预测的异构网络缓存决策方法技术

技术编号:26172846 阅读:50 留言:0更新日期:2020-10-31 13:52
本发明专利技术公开了一种基于用户偏好预测的异构网络缓存决策方法。在该方法中,宏基站、小基站和D2D通信并存,考虑到用户的移动性和社会关系影响。首先在用户偏好未知的情况下,采用机器学习的方法根据其请求历史记录预测用户偏好;然后考虑用户的移动性、物理位置关系、社会关系计算平均系统成本,在缓存容量的约束下,以小基站和重要用户的缓存策略为变量,构建了平均系统成本最小化的优化问题,通过求解该问题进行缓存决策。本发明专利技术所述方法基于分区拟阵上超模函数的最小化问题求解本发明专利技术的最优化问题,在保障次优解性能的前提下,大大减少了缓存决策的计算复杂度,从而通过在小基站和重要用户处缓存来大大减少系统成本。

【技术实现步骤摘要】
一种基于用户偏好预测的异构网络缓存决策方法
本专利技术属于无线通信技术,具体涉及一种基于用户偏好预测的异构网络缓存决策方法。
技术介绍
随着移动互联网的发展,无线移动设备急剧增长,产生了大量的数据流量,给移动通信带来了挑战,在本地缓存流行的文件便是应对这些挑战的解决方案之一。5G异构网络通过部署小基站来卸载宏基站的流量负荷,但是小基站的回程线路成为系统性能的瓶颈。缓存技术通过预先在部分用户和小基站中缓存流行的文件,当用户需要这些文件时,可以通过小基站或D2D通信来获得这些文件,而不用占用小基站的回程链路和宏基站的带宽,在流量高峰期避免了网络的拥塞,同时也可以降低时延,从而提升了QoS。但是,考虑到缓存成本的限制,小基站部署的缓存设备容量有限,而移动设备的存储容量更小,远远小于互联网内容库的容量,因此制定正确的缓存决策来确定缓存中放置的文件,对提高缓存命中率是非常重要的。
技术实现思路
专利技术目的:为了克服现有技术中存在的不足,本专利技术提供一种基于用户偏好预测的异构网络缓存决策方法。为实现上述目的,本专利技术所提供的技术方案如下:一种基于用户偏好预测的异构网络缓存决策方法,所述方法中宏基站、小基站和D2D的通信方式并存,包括如下步骤:(S1)首先在用户请求不同文件的概率分布未知的情况下,通过机器学习根据其请求历史记录预测用户偏好;(S2)基于用户的移动性、物理位置关系、社会关系推导平均系统成本的表达式,在缓存容量的约束下,以小基站和重要用户的缓存策略为变量,构建平均系统成本最小化的优化问题,通过求解该问题进行缓存决策;(S3)基于贪心算法的次优算法对平均系统成本最小化的优化问题进行求解,按照解向量决定予以缓存的文件。进一步的,本专利技术所述方法的算法处理过程具体如下:(1)用S={1,...,S}、U={1,2,...,U}、C={1,...,C}和F={1,...,C*Fc}分别表示小基站集、用户集、文件类别集和文件集,其中S、U、C、Fc分别表示小基站数、用户数、文件类别数和每类文件数,用tmin、tmin′分别表示通过D2D和通过小基站下载每个文件需要最小通信时间,宏基站包含内容库中的全部文件;(2)将时间划分为等长的时隙,t∈N表示第t个时隙,其起始时刻是τt,所有时隙长度都为T,每个时隙开始,即当前时隙的用户初始D2D连接情况其中指示函数代表用户i和用户j在t时隙开始是否可以进行D2D通信,可以为1反之为0,然后每个用户按照其偏好随机的请求文件,构成文件请求向量其中是用户i在t时隙请求的文件;(3)用指示变量表示用户间的物理关系,如果用户i和用户j在t时刻具有物理关系,则若没有则用μi,j表示用户i与用户j间连接时长服从的指数分布的参数,用λi,j表示用户i与用户j间隔时长服从的指数分布参数,根据用户i和用户j在t0时刻的连接情况计算用户i和用户j在tc时刻相连的概率(4)用μ′u,s和λ′u,s表示用户u和小基站s间的连接时长和间隔时长分别服从的指数分布的参数,用指示变量表示用户u和小基站s间的物理关系,根据t0时刻的连接情况计算用户u和小基站s在tc时刻相连的概率(5)用Si,j表示用户i与用户j之间的社会关系,用ST表示社会关系阈值,基于Si,j和ST计算用户间的社会联系si,j,,用θu表示用户u的社会重要性,用来衡量用户的社会重要程度,计算每个用户的社会重要性θu=α·Vu+β·Bu,其中Vu,Bu分别代表用户u的设备容量和中介中心性,α,β是权重系数,且满足α+β=1,依据社会重要性选取重要用户来缓存文件;(6)用H={H1,H2,...,HU}表示决策时刻前Tb个时隙的历史文件请求其中代表用户u的请求历史,为前Tb个时隙中第tb个时隙时请求的文件,根据历史文件请求H计算出基于次数的用户对每类文件的经验概率分布并作为K-means算法的数据集;(7)计算不同K值下所有数据点到其聚类中心点的距离之和作为衡量当前K-means模型的性能度量,其计算表达式如下所示:其中X为数据点向量,距离采用欧式距离;(8)计算Gap(K)=E(logDK)-logDK作为GapStatistic,其中E(logDK)为logDK的期望,选取使Gap(K)最大的K值optK作为用户分类的类别数;(9)针对每一类用户,计算其聚类中心作为该类用户请求该类文件的经验概率分布,将聚类中心从大到小排序,并获得对应的索引向量,取前五名的值和排名取对数后作为y,x数据进行线性回归求得Zipf分布参数s;(10)计算该类用户请求每类文件的概率,其计算表达式如下所示:依据对每类文件中文件的偏好服从均匀分布求出用户文件偏好(请求所有文件的概率分布)其中代表用户u请求第f个文件的概率;(11)重复步骤(9)至步骤(10)直至optK类用户的文件偏好都被求出,得到所有用户的文件偏好集合(12)令从自身或者或通过D2D通信从重要用户中获取文件的花费为ξ1;从小基站获取文件的花费为ξ2;从宏基站获取文件的开销为ξ3,用户首先考虑从自身存储或重要用户获取请求文件,没有则考虑从小基站,都没有换成则从宏基站获取;(13)令N代表重要用户数,令代表所有重要用户和小基站缓存放置策略变量,推导得到平均系统开销f(x)的表达式,初始化i=N+1,xsubopt为长度为(N+S)F的全零向量;(14)令j=1,令集合Fleft={1,...,F};(15)令然后令xsubopt中第(i-1)F+fopt个元素值为1,去掉集合Fleft中的fopt元素,最后令j=j+1;(16)重复执行步骤(15)直至j>Vi′。更进一步地,所述步骤(3)中的计算公式如下所示:步骤(4)中的计算公式为:更进一步地,步骤(5)中社会关系Si,j的计算公式如下所示:其中Ai代表用户i的社交属性,社交属性指用户在社交网络上兴趣标签、群组等,frequency(k)代表一共几个用户共有k社交属性,用户i与用户j之间的共有社会属性越冷僻,则他们的社会关系越紧密;中社会关系si,j的判定如下:当Si,j>=ST时,才认为用户i与用户j之间具有社会联系,此时si,j=1,否则没有,si,j=0。更进一步地,中介中心性Bu的计算公式具体如下:其中bi,j代表图Gs中顶点i∈VU和顶点j∈VU之间最短路径条数,bi,j(gu)代表图Gs中顶点i∈VU和顶点j∈VU间经过Vu的最短路径的条数;更进一步地,所述步骤(6)中经验概率分布的计算公式为:其中1A(x)代表指示函数,如果条件x为真,其值为1,否则为0;更进一步地,所述步骤(10)中的计算公式为:其中cf是文件f所属的文件类别并满足代表拟合Zipf分布得到的用户u请求ci类中文件的概率。更进一步地,步骤(13)中平均系本文档来自技高网...

【技术保护点】
1.一种基于用户偏好预测的异构网络缓存决策方法,其特征在于:所述方法中宏基站、小基站和D2D的通信方式并存,包括如下步骤:/n(S1)首先在用户请求不同文件的概率分布未知的情况下,通过机器学习根据用户请求历史记录预测用户偏好;/n(S2)基于用户的移动性、物理位置关系、社会关系推导平均系统成本的表达式,在缓存容量的约束下,以小基站和重要用户的缓存策略为变量,构建平均系统成本最小化的优化问题,通过求解该问题进行缓存决策;/n(S3)基于贪心算法的次优算法对平均系统成本最小化的优化问题进行求解,按照解向量决定予以缓存的文件。/n

【技术特征摘要】
1.一种基于用户偏好预测的异构网络缓存决策方法,其特征在于:所述方法中宏基站、小基站和D2D的通信方式并存,包括如下步骤:
(S1)首先在用户请求不同文件的概率分布未知的情况下,通过机器学习根据用户请求历史记录预测用户偏好;
(S2)基于用户的移动性、物理位置关系、社会关系推导平均系统成本的表达式,在缓存容量的约束下,以小基站和重要用户的缓存策略为变量,构建平均系统成本最小化的优化问题,通过求解该问题进行缓存决策;
(S3)基于贪心算法的次优算法对平均系统成本最小化的优化问题进行求解,按照解向量决定予以缓存的文件。


2.根据权利要求1所述的基于用户偏好预测的异构网络缓存决策方法,其特征在于:所述方法的算法处理过程具体如下:
(1)用S={1,...,S}、U={1,2,...,U}、C={1,...,C}和F={1,...,C*Fc}分别表示小基站集、用户集、文件类别集和文件集,其中S、U、C、Fc分别表示小基站数、用户数、文件类别数和每类文件数,用tmin、tmin′分别表示通过D2D和通过小基站下载每个文件需要最小通信时间,宏基站包含内容库中的全部文件;
(2)将时间划分为等长的时隙,t∈N表示第t个时隙,其起始时刻是τt,所有时隙长度都为T,每个时隙开始,即当前时隙的用户初始D2D连接情况其中指示函数代表用户i和用户j在t时隙开始是否能够进行D2D通信,用“1”或“0”表示;然后每个用户按照其偏好随机的请求文件,构成文件请求向量Rt={rit:i=1,...,U},其中rit∈F是用户i在t时隙请求的文件;
(3)通过指示变量表示用户间的物理关系,如果用户i和用户j在t时刻具有物理关系,则若没有则定义μi,j表示用户i与用户j间连接时长服从的指数分布的参数,用λi,j表示用户i与用户j间隔时长服从的指数分布参数,根据用户i和用户j在t0时刻的连接情况计算用户i和用户j在tc时刻相连的概率
(4)定义μ′u,s和λ′u,s表示用户u和小基站s间的连接时长和间隔时长分别服从的指数分布的参数,指示变量表示用户u和小基站s间的物理关系,根据t0时刻的连接情况计算用户u和小基站s在tc时刻相连的概率
(5)定义Si,j表示用户i与用户j之间的社会关系,用ST表示社会关系阈值,基于Si,j和ST计算用户间的社会联系si,j,用θu表示用户u的社会重要性,用来衡量用户的社会重要程度,计算每个用户的社会重要性θu=α·Vu+β·Bu,其中Vu,Bu分别代表用户u的设备容量和中介中心性,α,β是权重系数,且满足α+β=1,依据社会重要性选取重要用户来缓存文件;
(6)构建H={H1,H2,...,HU}表示决策时刻前Tb个时隙的历史文件请求其中代表用户u的请求历史,为前Tb个时隙中第tb个时隙时请求的文件,根据历史文件请求H计算出基于次数的用户对每类文件的经验概率分布,并用表示用户u请求第ci类文件的概率,并作为K-means算法的数据集;
(7)计算不同K值下所有数据点到其聚类中心点的距离之和作为衡量当前K-means模型的性能度量,计算表达式如下:



其中X为数据点向量,Mi代表第i类的聚类中心,距离采用欧式距离;
(8)计算Gap(K)=E(logDK)-logDK作为GapStatistic,其中E(logDK)为logDK的期望,选取使Gap(K)最大的K值optK作为用户分类的类别数;
(9)针对每一类用户,计算其聚类中心作为该类用户请求该类文件的经验概率分布,将聚类中心从大到小排序,并获得对应的索引向量,按照排序取值和排名取对数后作为y,x数据进行线性回归求得Zipf分布参数s;
(10)计算该类用户请求每类文件的概率,其计算表达式如下所示:

【专利技术属性】
技术研发人员:朱琦单冠捷
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1