一种基于内容流行度的数据分发方法、系统及存储介质技术方案

技术编号:21771827 阅读:27 留言:0更新日期:2019-08-03 21:36
本发明专利技术公开了一种基于内容流行度的数据分发方法、系统及计算机可读存储介质,本发明专利技术设计了包含“数据服务中心‑数据服务中心‑数据用户”三个层级的移动数据服务系统模型,本发明专利技术的数据服务中心能够优化本地存储的数据内容,增强自身服务用户的能力,降低从数据内容服务器取数据的次数。同时,本发明专利技术通过对用户数据需求信息的在线学习实时估计数据内容流行度,并基于此提出了基于内容流行度的缓存替换算法。相比于传统的缓存替换算法,该缓存替换算法能增加缓存命中率,具有更快的收敛速度,在移动数据服务系统中可以为用户提供更高质量和更低成本的数据服务。

A Data Distribution Method, System and Storage Medium Based on Content Popularity

【技术实现步骤摘要】
一种基于内容流行度的数据分发方法、系统及存储介质
本专利技术涉及计算机
,特别是涉及一种基于内容流行度的数据分发方法、系统及计算机可读存储介质。
技术介绍
移动信息系统的应用场景具有通信带宽受限、实时性要求高、系统用户数量众多、机动性强、散布范围广等特点,并且随着侦察感知手段的不断增强,数据集规模也急剧膨胀。传统的数据分发方式为发布/订阅机制。发布订阅机制中有两类角色,发布者和订阅者。发布者生成信息,给共享的信息命名(称为主题),并将信息直接发送给感兴趣的订阅者;订阅者注册感兴趣的主题,并在主题信息有变化时接收信息。发布订阅机制在日常生活中的例子有广播电视、杂志、新闻报纸等。近年来,逐步出现了一些基于用户兴趣的数据分发模型,通过朴素贝叶斯、人工神经网络、加权内容相似度等方法对用户的历史数据和定制信息进行分析,挖掘用户兴趣,建立用户兴趣模型,将实时数据与用户兴趣模型匹配,向用户推送其感兴趣的数据,过滤其不感兴趣的数据,从而实现按需分发。由于数据服务中心和终端用户往往在物理上和逻辑上都有较远的距离,数据的传递过程需要经过多次转发,从而影响了现有的数据分发方法中数据服务时效性。
技术实现思路
本专利技术提供了一种基于内容流行度的数据分发方法、系统及计算机可读存储介质,以解决现有技术中现有的数据分发方法中数据服务时效性差的问题。本专利技术一方面提供了一种基于内容流行度的数据分发方法,包括:预设数据服务站;所述数据服务站基于内容流行度从数据服务中心获取数据信息,进行缓存,并向周边预定范围内的用户提供数据服务。优选地,所述数据服务站基于内容流行度从数据服务中心获取数据信息,包括:所述数据服务站通过流行度估计函数计算内容流行度,并根据内容的流行度从数据服务中心获取数据信息。优选地,所述数据服务站基于内容流行度从数据服务中心获取数据信息,进行缓存,并向周边预定范围内的用户提供数据服务,包括:创建向量Tf和Rf,并初始化为0,其中,Rf为数据f总的用户请求次数,Tf为数据f总的缓存次数,在初始化阶段,每个周期Δt,从数据内容服务器顺序取m个数据进行缓存,直到所有的数据内容都被至少缓存一次,初始化阶段结束,将缓存记作C,其大小为m,当前缓存C中的数据集合记作计算当前周期的数据内容流行度,通过内容流行度函数,缓存替换决策基于Tf,Rf和周期数n计算数据流行度计算下一步需要缓存的内容计算方法为:对PEF(f)进行排序,选取流行度最大的m个数据作为下一步应该存储的数据计算Cexpired和Cnew,其中Cexpired表示在中而不在中的数据集,Cnew表示在中而不在中的数据集,计算公式如下:数据分发,当收到一条用户数据请求后,从数据内容服务器获取相应的数据fk,当则将该数据信息直接分发至用户,当则从数据内容服务器获取数据fk并将其分发至用户.优选地,所述数据服务站根据预设的缓存替换策略对缓存的数据进行更新。优选地,所述缓存替换策略包括:如果fk∈Cnew,则从本地缓存中随机地删除一个数据fk',fk'∈Cexpried,并存储fk,将fk的索引从中移除,将fk'的索引从Cexpried中移除;否则,直接更新Tf和Rf。本专利技术另一方面提供了一种基于内容流行度的数据分发系统,包括:数据服务中心,用于存储全部的数据信息,通过卫星通信与数据服务站进行通信,提供数据服务;数据用户,用于从数据服务站订阅数据信息;数据服务站,用于基于内容流行度从数据服务中心获取数据信息,进行缓存,并向周边预定范围内的数据用户提供数据服务。优选地,所述数据服务站还用于,创建向量Tf和Rf,并初始化为0,其中,Rf为数据f总的用户请求次数,Tf为数据f总的缓存次数,在初始化阶段,每个周期Δt,从数据内容服务器顺序取m个数据进行缓存,直到所有的数据内容都被至少缓存一次,初始化阶段结束,将缓存记作C,其大小为m,当前缓存C中的数据集合记作计算当前周期的数据内容流行度,通过内容流行度函数,缓存替换决策基于Tf,Rf和周期数n计算数据流行度计算下一步需要缓存的内容计算方法为:对PEF(f)进行排序,选取流行度最大的m个数据作为下一步应该存储的数据计算Cexpired和Cnew,其中Cexpired表示在中而不在中的数据集,Cnew表示在中而不在中的数据集,计算公式如下:数据分发,当收到一条用户数据请求后,从数据内容服务器获取相应的数据fk,当则将该数据信息直接分发至用户,当则从数据内容服务器获取数据fk并将其分发至用户.优选地,所述数据服务站还用于,根据预设的缓存替换策略对缓存的数据进行更新。优选地,所述缓存替换策略包括:如果fk∈Cnew,则从本地缓存中随机地删除一个数据fk',fk'∈Cexpried,并存储fk,将fk的索引从中移除,将fk'的索引从Cexpried中移除;否则,直接更新Tf和Rf。本专利技术再一方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有信号映射的计算机程序,所述计算机程序被至少一个处理器执行时,以实现上述任一种所述的基于内容流行度的数据分发方法。本专利技术有益效果如下:本专利技术设计了包含“数据服务中心-数据服务站-数据用户”三个层级的移动数据服务系统模型,本专利技术的数据服务站能够优化本地存储的数据内容,增强自身服务用户的能力,降低从数据内容服务器取数据的次数。同时,本专利技术通过对用户数据需求信息的在线学习实时估计数据内容流行度,并基于此提出了基于内容流行度的缓存替换算法。相比于传统的缓存替换算法,该缓存替换算法能增加缓存命中率,具有更快的收敛速度,在移动数据服务系统中可以为用户提供更高质量和更低成本的数据服务。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1是本专利技术实施例的数据服务系统的模型的结构示意图;图2是本专利技术实施例的数据缓存节点架构与信息交互关系示意图;图3是本专利技术实施例的一种数据分发算法的流程示意图;图4是本专利技术实施例的另一种数据分发算法的流程示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。本专利技术第一实施例提供了一种基于内容流行度的数据分发系统,如图1所示,该系统包括:数据服务中心,用于存储全部的数据信息,通过卫星通信与数据服务站进行通信,提供数据服务;数据用户,用于从数据服务站订阅数据信息;数据服务站,用于基于内容流行度从数据服务中心获取数据信息,进行缓存,并向周边预定范围内的数据用户提供数据服务。本专利技术设计了包含“数据服务中心-数据服务站-数据用户”三个层级的移动数据服务系统模型,本专利技术的数据服务站能够优化本地存储的数据内容,增强自本文档来自技高网...

【技术保护点】
1.一种基于内容流行度的数据分发方法,其特征在于,包括:预设数据服务站;所述数据服务站基于内容流行度从数据服务中心获取数据信息,进行缓存,并向周边预定范围内的用户提供数据服务。

【技术特征摘要】
1.一种基于内容流行度的数据分发方法,其特征在于,包括:预设数据服务站;所述数据服务站基于内容流行度从数据服务中心获取数据信息,进行缓存,并向周边预定范围内的用户提供数据服务。2.根据权利要求1所述的方法,其特征在于,所述数据服务站基于内容流行度从数据服务中心获取数据信息,包括:所述数据服务站通过流行度估计函数计算内容流行度,并根据内容的流行度从数据服务中心获取数据信息。3.根据权利要求1所述的方法,其特征在于,所述数据服务站基于内容流行度从数据服务中心获取数据信息,进行缓存,并向周边预定范围内的用户提供数据服务,包括:创建向量Tf和Rf,并初始化为0,其中,Rf为数据f总的用户请求次数,Tf为数据f总的缓存次数,在初始化阶段,每个周期Δt,从数据内容服务器顺序取m个数据进行缓存,直到所有的数据内容都被至少缓存一次,初始化阶段结束,将缓存记作C,其大小为m,当前缓存C中的数据集合记作计算当前周期的数据内容流行度,通过内容流行度函数,缓存替换决策基于Tf,Rf和周期数n计算数据流行度计算下一步需要缓存的内容计算方法为:对PEF(f)进行排序,选取流行度最大的m个数据作为下一步应该存储的数据计算Cexpired和Cnew,其中Cexpired表示在中而不在中的数据集,Cnew表示在中而不在中的数据集,计算公式如下:数据分发,当收到一条用户数据请求后,从数据内容服务器获取相应的数据fk,当则将该数据信息直接分发至用户,当则从数据内容服务器获取数据fk并将其分发至用户。4.根据权利要求3所述的方法,其特征在于,所述数据服务站根据预设的缓存替换策略对缓存的数据进行更新。5.根据权利要求4所述的方法,其特征在于,所述缓存替换策略包括:如果fk∈Cnew,则从本地缓存中随机地删除一个数据fk',fk'∈Cexpried,并存储fk,将fk的索引从中移除,将fk'的索引从Cexpried中移除;否则,直接更新Tf和Rf。6.一种基于内容...

【专利技术属性】
技术研发人员:杨慧杰刘娜李国栋陈健军
申请(专利权)人:中国电子科技集团公司电子科学研究院
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1