The invention discloses a method and apparatus for adaptive storage file, the method includes: cold heat property to determine the file, cold heat attribute characterization of the document in the file access frequency; cold heat according to the attributes of the file, the file encoding or transcoding execution storage storage processing. Therefore, according to the method and apparatus for adaptive storage file of an embodiment of the invention, according to the cold properties file to file with the corresponding codec technology for storage processing, so it can fully consider the file attributes for cold storage cost and recovery cost, and reliability of coding and decoding technology of the high. Coding and decoding speed, therefore, can improve the comprehensive performance of storage cost and recovery cost, reliability and speed of coding multiple dimensions.
【技术实现步骤摘要】
一种自适应存储文件的方法和装置
本专利技术涉及存储领域,并且更具体地,涉及一种自适应存储文件的方法和装置。
技术介绍
在分布式文件系统中,为了减小存储开销,可以采用纠删码(ErasureCode,EC)技术对数据进行编解码代替多副本复制的方案,每种EC技术都有各自的优点,有的可靠性高,有的恢复成本低,有的存储开销低。例如,点积编解码(ProductCode,PC)算法采用了水平和垂直两个方向的编码方式,只进行XOR运算,得到高的编解码速度和低恢复成本,但存储开销高,本地重建编解码(LocallyReconstructionCode,LRC)算法的存储开销低,但是多节点失效时的恢复成本高。因此现有EC技术的综合性能还有待提升。
技术实现思路
本专利技术实施例提供一种自适应存储文件的方法和装置,能够提高存储开销、恢复成本、可靠性和编解码速度多个维度的综合性能。第一方面,提供了一种自适应存储文件的方法,该方法包括:确定该文件的冷热度属性,该文件的冷热度属性表征该文件被访问的频率;根据该文件的冷热度属性,对该文件执行编码存储或转码存储处理。该方法自适应使用多种EC技术,同时降低了存储开销和恢复成本,整体上兼顾了各方面的性能。结合第一方面,在第一方面的第一种实现方式中,该确定文件的冷热度属性,包括:根据该文件的访问频率和/或该文件的平均访问时间间隔,确定该文件的冷热度属性;在该文件的访问频率大于第一频率阈值,或该文件的平均访问时间间隔小于第一时间间隔时,确定该文件的冷热度属性为热;或在该文件的访问频率不大于第一频率阈值,或该文件的平均访问时间间隔不小于第一时间间隔时,确 ...
【技术保护点】
一种自适应存储文件的方法,其特征在于,所述方法包括:确定所述文件的冷热度属性,所述文件的冷热度属性表征所述文件被访问的频率;根据所述文件的冷热度属性,对所述文件执行编码存储或转码存储处理。
【技术特征摘要】
1.一种自适应存储文件的方法,其特征在于,所述方法包括:确定所述文件的冷热度属性,所述文件的冷热度属性表征所述文件被访问的频率;根据所述文件的冷热度属性,对所述文件执行编码存储或转码存储处理。2.根据权利要求1所述的方法,其特征在于,所述确定文件的冷热度属性,包括:根据所述文件的访问频率和/或所述文件的平均访问时间间隔,确定所述文件的冷热度属性;在所述文件的访问频率大于第一频率阈值,或所述文件的平均访问时间间隔小于第一时间间隔时,确定所述文件的冷热度属性为热;或在所述文件的访问频率不大于所述第一频率阈值,或所述文件的平均访问时间间隔不小于所述第一时间间隔时,确定所述文件的冷热度属性为冷。3.根据权利要求1或2所述的方法,其特征在于,所述根据所述文件的冷热度属性,对所述文件执行编码存储或转码存储处理,包括:当确定所述文件的冷热度属性为热时,采用第一编解码算法对所述文件进行编码存储处理;或当确定所述文件的冷热度属性为冷时,采用第二编解码算法对所述文件进行编码存储处理;其中,所述第一编解码算法的恢复成本低于恢复成本阈值,所述第二编解码算法的存储开销低于存储开销阈值。4.根据权利要求1或2所述的方法,其特征在于,所述根据所述文件的冷热度属性,对所述文件执行编解码或转码存储处理,包括:根据所述文件的冷热度属性的变化,对所述文件执行转码存储处理。5.根据权利要求4所述的方法,其特征在于,所述根据所述文件的冷热度属性的变化,对所述文件执行转码存储处理,包括:当确定所述文件的冷热度属性由冷转变为热时,对所述文件执行从第一源编解码算法到第一目标编解码算法的转码存储处理;或当确定所述文件的冷热度属性由热转变为冷时,对所述文件执行从第二源编解码算法到第二目标编解码算法的转码存储处理;其中,所述第一目标编解码算法的恢复成本低于恢复成本阈值,所述第一源编解码算法的恢复成本不低于所述恢复成本阈值,所述第二目标编解码算法的存储开销低于存储开销阈值,所述第二源编解码算法的存储开销不低于存储开销阈值。6.根据权利要求5所述的方法,其特征在于,所述对所述文件执行从第一源编解码算法到第一目标编解码算法的转码存储处理,包括:将第一源校验码减去第一差值校验码后得到的结果确定为第一目的校验码;其中,所述文件包括N个数据块,所述第一源校验码是基于第一编码函数对所述N个数据块编码产生的,所述第一目的校验码是基于所述第一编码函数对所述N个数据块中的M个数据块编码产生的,所述第一差值校验码是基于所述第一编码函数对所述N个数据块中的除所述M个数据块以外的数据块编码产生的,所述第一编码函数为基于所述第一源编解码算法的编码函数,所述N,M为正整数,N>M。7.根据权利要求5所述的方法,其特征在于,所述对所述文件执行从第二源编解码算法到第二目标编解码算法的转码存储处理,包括:将第二源校验码加上第二差值校验码后得到的结果确定为第二目的校验码;其中,所述文件包括N个数据块,所述第二源校验码是基于第二编码函数对所述N个数据块中的M个数据块编码产生的,所述第二目的校验码是基于所述第二编码函数对所述N个数据块编码产生的,所述第二差值校验码是基于所述第二编码函数对所述N个数据块中的除所述M个数据块以外的数据块编码产生的,所述第二编码函数为基于所述第二源编解码算法的编码函数,所述N,M为正整数,N>M。8.根据权利要求3所述的方法,其特征在于,在所述确定文件的...
【专利技术属性】
技术研发人员:庄仕岳,肖宇雷,涂丹丹,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。