一种面向内容中心网络中基于内容分类的类别流行度缓存替换方法技术

技术编号:10857499 阅读:137 留言:0更新日期:2015-01-01 08:51
本发明专利技术涉及一种面向内容中心网络中基于内容分类的类别流行度缓存替换方法。本发明专利技术包括:先判断节点剩余的缓存空间是否能够容纳新的数据内容;如果有足够的缓存空间缓存新数据内容;根据指数加权移动平均计算标准计算节点中所有内容类别的流行度,选择流行度最小的内容类别;将流行度最小的内容类别中预定义时间内被请求次数最少的内容项移除节点缓存;提取新数据内容名字字符串特征并进行分类;将新到达的数据内容项存入节点中相应的内容类别中,更新类别热度表和日志。本发明专利技术按内容名字分类可以更好的管理CCN中节点的缓存,使网络在通信过程中从内容名入手对内容进行查找和替换,平衡节点缓存中内容的多样性,提高缓存替换的效率。

【技术实现步骤摘要】
一种面向内容中心网络中基于内容分类的类别流行度缓存替换方法
本专利技术涉及一种面向内容中心网络中基于内容分类的类别流行度缓存替换方法。
技术介绍
随着互联网的持续发展,人们对网络中内容的需求越来越大。当前基于TCP/IP的网络架构在网络控制、资源分配等方面的问题日益突出,互联网的重心已经从主机与主机之间的通信转移到怎样从互联网快速获取所要请求的内容。基于这个原因,国内外学者着手研究新的下一代网络体系架构,并展开了多个相关项目课题的研究,推动了下一代网络的发展,具有跨时代的意义。本专利技术主要研究的是一种新型的未来网络体系架构“内容中心网络”。CCN抛弃了传统网络中以主机地址为核心的通信方式,而转为以命名的内容为中心的网络思想,同时构建了新的体系结构和通信机制来适应未来网络的发展。文献《内容中心网络CCN研究进展探析》综述了CCN的相关研究,介绍了CCN的工作机制,并调研了当前CCN的研究热点问题及其挑战,分析了CCN主要比较优势与存在的问题,最后通过实验测试床验证了CCN的工作模式。缓存替换策略是CCN研究的关键部分,它关系到网络的整体性能。在CCN中经常使用的缓存替换策略有最近最少使用策略和最少使用频率策略及其它们的改进策略。文献《Modelingdatatransferincontent-centricnetworking》提到的LRU缓存替换策略,具有算法简单、易于实现、方便部署等特点,但是它们并没有充分考虑CCN动态性的特点,因此具有很大程度的不适应性。本专利技术提出了一种基于内容名字分类的类别流行度缓存替换策略,该策略根据CCN中内容的命名方式和名字唯一性的特点,提出了all-gram和R-值相结合的方法对内容名字字符串进行特征提取并分类,使得每个节点中的缓存首先以类别为单位来进行管理。并且采用指数加权移动平均的思想来计算每个节点中类别的流行度,通过时间距离大小对每个类别在规定的时间里被访问的次数赋予不同的权值来反映实时的流行度情况。在缓存替换过程中,优先替换节点中流行度最低的内容类别中的内容项,然后根据分类判定方法将新的内容存入节点中所属的相应类别中。
技术实现思路
本专利技术目的在于提供通过内容分类和动态计算流行度的方式来实现缓存替换,能够充分考虑网络内容最近的动态特性,提高网络内容分发效率,减少节点有限网络缓存浪费的一种内容中心网络中基于内容分类的类别流行度缓存替换方法。本专利技术的目的是这样实现的:(1)当有新的数据内容到达时,先判断节点剩余的缓存空间是否能够容纳新的数据内容;如果有足够的缓存空间缓存新数据内容,则直接执行步骤(4);如果没有足够的缓存空间缓存数据内容,则执行步骤(2),进行缓存替换;(2)根据指数加权移动平均计算标准计算节点中所有内容类别的流行度,选择流行度最小的内容类别;(3)将流行度最小的内容类别中预定义时间内被请求次数最少的内容项移除节点缓存;(4)提取新数据内容名字字符串特征并进行分类;(5)将新到达的数据内容项存入节点中相应的内容类别中,更新类别热度表和日志。步骤(1)中,在判断节点剩余的缓存空间是否能够容纳新的数据内容之前,先检查节点CS表,查看缓存中是否已缓存该新的数据内容。中包括根据all-gram和R-值相结合的方法提取新数据内容名字字符串特征并对内容进行分类:n-gram模型利用一个长度为n的滑动窗口来截取一系列的子字符串,滑动窗口每次滑动一个长度单位,将经过n-gram模型处理后的内容名字序列,分割成连续的长度都是n的子字符串。本专利技术具有的有益效果:本专利技术提出了一种基于内容分类的类别流行度的缓存替换算法,将内容分类有效地避免了在计算流行度的时候对所有的内容单独去处理,只需要计算出每个内容类的流行度。这样在需要执行缓存替换的时候,首先将节点中流行度最低的类别中的某一内容项替换出缓存,然后将新到达的内容数据按名字归入到节点缓存中的已有类别中,从而完成缓存替换过程。与传统的LRU替换方法不同,基于内容分类的类别流行度缓存替换方法,考虑到了内容类别流行度,可使流行度高的内容相对来说可长时间存储于网络节点中。区别于传统的选取最近最久未使用的内容块进行替换的LRU方法,本专利技术提出的方法在步骤2、3中选取类别流行度最低的内容进行替换。并且,在步骤4中提出了根据all-gram和R-值相结合的方法将内容进行分类的思想,按内容名字分类可以更好的管理CCN中节点的缓存,使网络在通信过程中从内容名入手对内容进行查找和替换,平衡节点缓存中内容的多样性,提高缓存替换的效率。仿真实验结果表明,本专利技术提出的基于内容名字分类的类别流行度缓存替换策略相比于其它经典的替换策略在性能上具有一定的优势。附图说明图1是本专利技术的总流程图;图2是本专利技术的网络拓扑结构示意图;图3是本专利技术的实验仿真参数表示意图;图4是本专利技术的计算流行度示例示意图;图5是本专利技术的n-gram示例示意图;图6是本专利技术的all-gram计算r值提取特征组合方法流程图;图7是本专利技术的不同大小节点缓存空间下平均缓存命中率示意图;图8是本专利技术的不同数目存根域下的平均缓存命中率示意图;图9是本专利技术的缓存命中率的恢复能力示意图;图10是本专利技术的不同大小节点缓存下服务器平均负载示意图;图11是本专利技术的不同数目存根域下服务器平均负载示意图;图12是本专利技术的样本时间选择大小对缓存命中率和服务器负载的影响示意图。具体实施方式下面结合附图举例对本专利技术做更详细地描述。1、一种面向内容中心网络中基于内容分类的类别流行度缓存替换方法,其特征在于:步骤1:当有新的数据内容到达时,先判断节点剩余的缓存空间是否能够容纳新的内容;如果有足够的缓存空间缓存新数据,则直接进入步骤4;如果没有足够的缓存空间缓存数据,则进入步骤2,进行缓存替换,以缓存新数据。步骤2:根据指数加权移动平均(EWMA)计算标准计算节点中所有内容类别的流行度,选择流行度最小的内容类别;步骤3:将流行度最小的内容类别中预定义时间内被请求次数最少的内容项移除节点缓存;步骤4:根据all-gram和R-值相结合的方法提取新内容名字字符串特征并进行分类;步骤5:将新到达的内容项存入节点中相应的内容类别中,更新类别热度表和日志。步骤1中,在判断是否有足够缓存空间缓存新数据之前,先检查节点CS表,查看缓存中是否已缓存该数据。CS表中存储了经过该节点且未被被该节点缓存的所有内容。步骤2中包括,提取新内容名字字符串特征并将内容进行分类,以及计算内容类别的流行度。根据all-gram和R-值相结合的方法提取新内容名字字符串特征并对内容进行分类:n-gram模型n-gram是利用一个长度为n的滑动窗口来截取一系列的子字符串,滑动窗口每次滑动一个长度单位。当一个内容名字序列经过n-gram模型处理后,就会被分割成若干个连续的长度都是n的子字符串。在分类过程中,分类的准确与否往往与n值的选择有很大的关系,n-gram算法中对于n值的选择没有固定的方法,有时候可能是根据人为的经验去尝试然后再选出最终的值。如果n值太小,可能会忽略字符串的结构和顺序,若n取值太大,则会降低字符串之间的相似度,造成错误的分类结果。因此,本专利技术提出了一种all-gram的思想。不再使用某一固定的n值对名字字符串进行分割,而是使用一系列的本文档来自技高网
...
一种面向内容中心网络中基于内容分类的类别流行度缓存替换方法

【技术保护点】
一种面向内容中心网络中基于内容分类的类别流行度缓存替换方法,其特征在于:(1)当有新的数据内容到达时,先判断节点剩余的缓存空间是否能够容纳新的数据内容;如果有足够的缓存空间缓存新数据内容,则直接执行步骤(4);如果没有足够的缓存空间缓存数据内容,则执行步骤(2),进行缓存替换;(2)根据指数加权移动平均计算标准计算节点中所有内容类别的流行度,选择流行度最小的内容类别;(3)将流行度最小的内容类别中预定义时间内被请求次数最少的内容项移除节点缓存;(4)提取新数据内容名字字符串特征并进行分类;(5)将新到达的数据内容项存入节点中相应的内容类别中,更新类别热度表和日志。

【技术特征摘要】
1.一种面向内容中心网络中基于内容分类的类别流行度缓存替换方法,其特征在于:(1)当有新的数据内容到达时,先判断节点剩余的缓存空间是否能够容纳新的数据内容;如果有足够的缓存空间缓存新数据内容,则直接执行步骤(4);如果没有足够的缓存空间缓存数据内容,则执行步骤(2),进行缓存替换;(2)根据指数加权移动平均计算标准计算节点中所有内容类别的流行度,选择流行度最小的内容类别;根据指数加权移动平均EWMA计算标准计算节点中所有内容类别的流行度,作为计算的标准,计算公式如下所示:Ci[j]是类别i在第j个时间段内被请求的次数,α表示权重;根据all-gram和R-值相结合的方法提取新内容名字字符串特征并进行分类;n-gram模型实质是N-1阶马尔科夫模型,n-gram是利用一个长度为n的滑动窗口来截取一系列的子字符串,滑动窗口每次滑动一个长度单位;当一个内容名字序列经过n-gram模型处理后,就会被分割成若干个连续的长度都是n的子字符串;本发明采用R-值的特征选择方法,这种方法根据计算出的R值来判断特征的特点并把特征进行排名,选择对更容易进行分类的特征集合,从而为分类提供了比较理想的标...

【专利技术属性】
技术研发人员:张国印邢志静武俊鹏夏松竹李庆显唐滨徐林枫
申请(专利权)人:哈尔滨工程大学
类型:发明
国别省市:黑龙江;23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1