云端储存设备系统及决定其架构的高速缓存中数据的方法技术方案

技术编号:17518019 阅读:82 留言:0更新日期:2018-03-21 02:28
本发明专利技术揭露一种云端储存设备系统及决定其架构的高速缓存中数据的方法。其中方法包括步骤:A、记录云端储存设备系统的高速缓存在过去一段时间内的处理内容;B、指定在未来的特定时间;C、基于参考时段,对每一来自处理内容的快取资料计算出与时间相关的置信度;D、排序与时间相关的置信度;及E、在该高速缓存中提供具有较高与时间相关的置信度的快取数据,并当该高速缓存在未来的特定时间前耗尽时,移除高速缓存中具有较低与时间相关的置信度的快取数据。其能在相关的时间之前,将最有可能被存取的数据储存在高速缓存中,以改进云端储存设备系统的性能。

The cloud storage device system and the method of determining the data in the cache for its architecture

The invention discloses a method of cloud storage device system and data in the cache that determines its architecture. The method comprises the steps of: A, cloud storage content cache record processing equipment system in the past period of time; B, specified in the specific time in the future; C, based on the reference time of each from the processing of content cached data to calculate the confidence associated with the time; D, sort of confidence time dependent; and E, in the cache provide a higher degree of confidence associated with the time when the data cache, and the cache in a specific time in the future before the depletion, remove the cache has a low degree of confidence associated with the time of cache data. It can store data that is most likely to be stored in the cache before relevant time to improve the performance of the cloud storage device system.

【技术实现步骤摘要】
云端储存设备系统及决定其架构的高速缓存中数据的方法
本专利技术涉及云端储存设备领域,特别是涉及一种云端储存设备系统及决定其架构的高速缓存中数据的方法。
技术介绍
对云端服务系统而言,通常会尝试尽可能快速地提供其服务给客户,以响应客户的请求。当客户数量不大时,这标的很容易达到。然而,如果客户数量大增,受制于云端服务系统的硬件架构以及网络流量,响应时间必然会有快慢之分,但应在合理范围之内。另一方面,如果云端服务在商业上与其它云端服务竞争,无论其受限于何种事物,该云端服务系统应技术性地以有限的资源在最短的时间内响应客户的请求。这是个常见的众多云端系统开发者面对的议题,大家都在期盼能够有合适的解决方案。在传统的工作环境中,请见图1,有许多客户端计算机1通过因特网3连接到服务器4。服务器4是主要处理客户请求的设备,可能会进行复杂的计算或仅执行储存数据的存取。对后者而言,储存的资料可以保留在快取5或辅助内存6中。快取5或辅助内存6的数量可以不限于1个,而是该云端服务所需的任何的数量。服务器4、快取5及辅助内存6形成云端服务系统的架构。快取5可能指的是动态随机存取内存(DynamicRandomAccessMemory,DRAM)或静态随机存取内存(StaticRandom-AccessMemory,SRAM)。辅助内存6可能是固态硬盘(SolidStateDrive,SSD)、硬盘(HardDiskDrive,HDD),可写式数字多功能激光视盘(DigitalVersatileDisc,DVD),甚或是磁带。快取5与辅助内存6的物理性差异在于断电时的数据储存性。对快取5而言,数据在需要使用时暂时性地储存而当断电时消失。然而,无论是否通电,辅助内存6均能够长久地储存数据。快取5具有快速存取数据的优点,但是却有挥发性(易失性)、高价格及较小储存空间的缺点。如上所述,很明显,为了达到多数请求所需的热数据(较多存取)能快速地被存取,并以可忍受的较慢速度提供冷数据(较少存取),决定合适的数据储存于快取5当中是很重要的,且能改善云端服务效能。平均而言,响应所有来自客户端计算机请求的时间会落在可接受的范围内。近来,有许多传统算法可用于决定何种数据应被快取储存(储存于快取5中)。举例而言,LeastRecentlyUsed(LRU)算法、MostRecentlyUsed(MRU)算法、Pseudo-LRU(PLRU)算法、SegmentedLRU(SLRU)算法、2-waysetassociative算法、Least-FrequentlyUsed(LFU)算法、LowInter-referenceRecentSet(LIRS)算法等等。这些算法由被分析数据本身的近因与频率的特性而执行,其结果与其它数据无关(不具有与资料相关的特性)。它们被归类为“与数据相关算法”,以原始的快取数据(来自前述传统快取算法的结果)当作标的数据以获得“与数据相关”的数据并进行快取储存。这意味着新的快取数据与原始快取数据有某种程度上的关联(新的快取资料有较高的机会与原始快取资料一同出现)。上述该些算法被察觉到在某些模式的工作负载上有效。然而,因为它们都计算出现于相对时段的数据,而不是绝对时段的数据,这导致了一个现象:被所有算法选出快取储存于第一时段(例如首8个小时)的数据,可能不尽然会在第二时段(例如首8个小时后的8个小时)中被存取。这很容易理解,因为几乎所有数据存取都是绝对时间相关或频率相关的,举例而言,在每天早晨8:55AM到9:05AM间开机、在每周三2:00PM开的会议、两周结算一次的工资、每月最后一天进行的盘点等等。因此,时间戳本身就是考虑快取数据的一个重要且独立因子。然而,目前尚未以时间戳为前提考虑快取储存的的解决方案。
技术实现思路
鉴于此,有必要针对传统技术中没有以时间戳为前提考虑快取储存的解决方案的问题,提供一种以在过去一段时间内被存取的与时间相关的数据来分析哪些数据应被快取储存,从而改进云端储存设备系统性能的云端储存设备系统及决定其架构的高速缓存中数据的方法。本专利技术提供一种用于决定云端储存设备架构的高速缓存中数据的方法,该方法包括步骤:A、记录云端储存设备系统的高速缓存在过去一段时间内的处理内容,其中每一处理内容包括记录时间,或记录时间与过去该段时间内被存取的快取数据;B、指定在未来的特定时间;C、基于参考时段,对每一来自处理内容的快取资料计算出与时间相关的置信度;D、排序所述与时间相关的置信度;及E、在所述高速缓存中提供具有较高与时间相关的置信度的快取数据,并当所述高速缓存在未来的所述特定时间前耗尽时,移除所述高速缓存中具有较低与时间相关的置信度的快取数据。在其中一个实施例中,步骤E可以步骤E’所取代:E’、提供具有较高与时间相关的置信度的快取数据与从至少一种其它快取算法计算得到的数据到高速缓存中,以在未来的所述特定时间前耗尽高速缓存的使用,其中在具有较高与时间相关的置信度的快取数据及从其它快取算法计算得到的数据间存在固定比率。在其中一个实施例中,所述固定比率是基于数据数量或数据占据空间而计算。在其中一个实施例中,所述特定时间包括一小时中的特定分钟、一天中的特定小时、一周中的特定日、一月中的特定日、一季中的特定日、一年中的特定日、一月中的特定周、一季中的特定周、一年中的特定周,或一年中的特定月。在其中一个实施例中,以二连续记录的处理内容间隔时间跨度的方式定期地记录所述些处理内容。在其中一个实施例中,所述参考时段包括在一小时中的特定分钟内、在一日中的特定小时内,或在一年中的特定日内。在其中一个实施例中,所述与时间相关的置信度由下列步骤计算得到:C1、计算第一数量,所述该第一数量为参考时段在过去该段时间内出现的数量;C2、计算第二数量,所述第二数量为当标的快取数据存取时,所述参考时段的数量;及C3、将所述第二数量除以所述第一数量。在其中一个实施例中,所述快取算法包括LeastRecentlyUsed(LRU)算法、MostRecentlyUsed(MRU)算法、Pseudo-LRU(PLRU)算法、RandomReplacement(RR)算法、SegmentedLRU(SLRU)算法、2-waysetassociative算法、Least-FrequentlyUsed(LFU)算法、LowInter-referenceRecentSet(LIRS)算法、AdaptiveReplacementCache(ARC)算法、ClockwithAdaptiveReplacement(CAR)算法、MultiQueue(MQ)算法,或以来自步骤D的结果作为标的数据的与数据相关算法。在其中一个实施例中,所述数据的型态包括对象、区块,或档案。本专利技术还提供一种云端储存设备系统,该云端储存设备系统包括:主机,用以存取数据;高速缓存,连接至所述主机,用以暂时储存快取数据供快速存取;处理内容记录器,配置到或安装在所述高速缓存,连接至所述主机以记录在过去一段时间内高速缓存的处理内容,其中每一处理内容包括记录时间,或记录时间与过去该段时间内被存取的快取数据、接收主机指定在未来的特定时间、基于参考时段,对每一来自处理内容的快取资料计算出与时间相关的置信度、排本文档来自技高网
...
云端储存设备系统及决定其架构的高速缓存中数据的方法

【技术保护点】
一种决定云端储存设备架构的高速缓存中数据的方法,其特征在于,所述方法包括步骤:A、记录云端储存设备系统的高速缓存在过去一段时间内的处理内容,其中每一处理内容包括记录时间,或记录时间与过去该段时间内被存取的快取数据;B、指定在未来的特定时间;C、基于参考时段,对每一来自处理内容的快取资料计算出与时间相关的置信度;D、排序所述与时间相关的置信度;及E、在所述高速缓存中提供具有较高与时间相关的置信度的快取数据,并当所述高速缓存在未来的所述特定时间前耗尽时,移除所述高速缓存中具有较低与时间相关的置信度的快取数据。

【技术特征摘要】
1.一种决定云端储存设备架构的高速缓存中数据的方法,其特征在于,所述方法包括步骤:A、记录云端储存设备系统的高速缓存在过去一段时间内的处理内容,其中每一处理内容包括记录时间,或记录时间与过去该段时间内被存取的快取数据;B、指定在未来的特定时间;C、基于参考时段,对每一来自处理内容的快取资料计算出与时间相关的置信度;D、排序所述与时间相关的置信度;及E、在所述高速缓存中提供具有较高与时间相关的置信度的快取数据,并当所述高速缓存在未来的所述特定时间前耗尽时,移除所述高速缓存中具有较低与时间相关的置信度的快取数据。2.如权利要求1所述的方法,其特征在于,所述特定时间包括一小时中的特定分钟、一天中的特定小时、一周中的特定日、一月中的特定日、一季中的特定日、一年中的特定日、一月中的特定周、一季中的特定周、一年中的特定周,或一年中的特定月。3.如权利要求1所述的方法,其特征在于,以二连续记录的处理内容间隔时间跨度的方式定期地记录所述处理内容。4.如权利要求1所述的方法,其特征在于,所述参考时段包括在一小时中的特定分钟内、在一日中的特定小时内,或在一年中的特定日内。5.如权利要求1所述的方法,其特征在于,所述与时间相关的置信度由下列步骤计算得到:C1、计算第一数量,所述第一数量为参考时段在过去该段时间内出现的数量;C2、计算第二数量,所述第二数量为当标的快取数据存取时,所述参考时段的数量;及C3、将所述第二数量除以所述第一数量。6.如权利要求1所述的方法,其特征在于,所述数据的型态包括对象、区块,或档案。7.一种决定云端储存设备架构的高速缓存中数据的方法,其特征在于,所述方法包括步骤:A、记录云端储存设备系统的高速缓存在过去一段时间内的处理内容,其中每一处理内容包括记录时间,或记录时间与过去该段时间内被存取的快取数据;B、指定在未来的特定时间;C、基于参考时段,对每一来自处理内容的快取资料计算出与时间相关的置信度;D、排序所述与时间相关的置信度;及E、提供具有较高与时间相关的置信度的快取数据与从至少一种其它快取算法计算得到的数据到高速缓存中,以在未来的所述特定时间前耗尽高速缓存的使用,其中在具有较高与时间相关的置信度的快取数据及从其它快取算法计算得到的数据间存在固定比率。8.如权利要求7所述的方法,其特征在于,所述固定比率是基于数据数量或数据占据空间而计算。9.如权利要求7所述的方法,其特征在于,所述快取算法包括LRU算法、MRU算法、PLRU算法、RR算法、SLRU算法、2-waysetassociative算法、LFU算法、LIRS算法、ARC算法、CAR算法、MQ算法,或以来自步骤D的结果作为标的数据的与数据相关算法。10.一种云端储存设备系统,其特征在于,所述系统包括:主机,用以存取数据;高速缓存,连接至所述主机,用以暂时储存快取数据供快速存取;处理内容记录器,配置到或安装到所述高速缓存,连接至所述主机以记录...

【专利技术属性】
技术研发人员:陈文贤谢文杰黄明仁
申请(专利权)人:先智云端数据股份有限公司
类型:发明
国别省市:中国台湾,71

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1