一种静态数据文件的存储方法技术

技术编号:14568994 阅读:64 留言:0更新日期:2017-02-06 02:46
本发明专利技术提供一种静态数据文件的存储方法,包括步骤:S1、获取待存储文件的元数据信息;S2、通过所述元数据信息计算所述待存储文件的指纹;S3、将所述待存储文件的指纹与已保存文件的指纹进行匹配,判断所述待存储文件的指纹是否存在;若存在,则返回所述已保存文件的指纹缓存并结束存储;若不存在,则缓存所述待存储的指纹缓存并结束存储。能在进行静态数据文件存储时,仅读取文件的元数据信息,判断是否需要进行存储,从而缩减用户的数据保护窗口时间、网络带宽占用、磁盘存储空间占用、磁盘IO占用等。能积极有效的帮助用户更快、更及时的完成数据保护,从而节省更多的物力成本和人力成本。

【技术实现步骤摘要】

本专利技术涉及文件存储领域,特别是涉及一种静态数据文件的存储方法
技术介绍
随着计算机的不断发展,数据保护也逐步在加强。然而随着数据的迅速增加,数据保护变得越来越难。磁盘IO瓶颈、网络带宽瓶颈、数据保护窗口时间均制约着大数据量数据的保护。在很多场景下的大数据量数据均是静态数据文件,这些数据文件在产生后便不再发生数据的修改。这些数据在进行数据保护时会多次被存储到数据保护中心,从而造成了数据存储空间的浪费,同时也造成了网络带宽的占用,延长了数据保护窗口时间。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种静态数据文件的存储方法,用于解决现有技术中数据存储空间的浪费,同时也造成了网络带宽的占用,延长了数据保护窗口时间的问题。为实现上述目的及其他相关目的,本专利技术提供一种静态数据文件的存储方法,包括步骤:S1、获取待存储文件的元数据信息;S2、通过所述元数据信息计算所述待存储文件的指纹;S3、将所述待存储文件的指纹与已保存文件的指纹进行匹配,判断所述待存储文件的指纹是否存在;若存在,则返回所述已保存文件的指纹缓存并结束存储;若不存在,则缓存所述待存储的指纹缓存并结束存储。于本专利技术的一实施例中,所述元数据信息包括:创建时间、修改时间、文件基本属性、文件自定义元数据、文件绝对路径和文件名称。于本专利技术的一实施例中,所述返回已保存文件的指纹缓存的步骤还包括步骤:S31、获取所述已保存文件的指纹缓存的唯一的第一存储ID;S32、通过所述第一存储ID获取所述已保存文件的指纹缓存;S33、返回所述已保存文件的指纹缓存。于本专利技术的一实施例中,所述缓存所述待存储的指纹缓存的步骤还包括步骤:S31’、存储所述待存储文件的指纹;S32’、生成所述待存储文件的指纹缓存唯一的第二存储ID;S33’、根据所述第二存储ID存储所述待存储文件的指纹缓存。于本专利技术的一实施例中,所述指纹为对应文件元数据信息的哈希值;通过哈希算法计算得出。如上所述,本专利技术的静态数据文件的存储方法,具有以下有益效果:能在进行静态数据文件存储时,仅读取文件的元数据信息,判断是否需要进行存储,从而缩减用户的数据保护窗口时间、网络带宽占用、磁盘存储空间占用、磁盘IO占用等。能积极有效的帮助用户更快、更及时的完成数据保护,从而节省更多的物力成本和人力成本。附图说明图1显示为本专利技术静态数据文件的存储方法的一实施例中的流程方框示意图。图2显示为本专利技术静态数据文件的存储方法的另一实施例中的流程方框示意图。具体实施方式以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本专利技术的基本构想,遂图式中仅显示与本专利技术中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。请参阅图1至2。如图1所示,图1显示为本专利技术静态数据文件的存储方法的一实施例中的流程方框示意图。本专利技术的一实施例中提供了一种静态数据文件的存储方法,包括步骤:S1、获取待存储文件的元数据信息;S2、通过所述元数据信息计算所述待存储文件的指纹;S3、将所述待存储文件的指纹与已保存文件的指纹进行匹配,判断所述待存储文件的指纹是否存在;若存在,则返回所述已保存文件的指纹缓存并结束存储;若不存在,则缓存所述待存储的指纹缓存并结束存储。能在进行静态数据文件存储时,仅读取文件的元数据信息,判断是否需要进行存储,从而缩减用户的数据保护窗口时间、网络带宽占用、磁盘存储空间占用、磁盘IO占用等。能积极有效的帮助用户更快、更及时的完成数据保护,从而节省更多的物力成本和人力成本。如图2所示,图2显示为本专利技术静态数据文件的存储方法的另一实施例中的流程方框示意图。在本专利技术的另一实施例中,本专利技术静态数据文件的存储方法包括步骤:S1、获取待存储文件的元数据信息;通常所述元数据信息包括:创建时间、修改时间、文件基本属性、文件自定义元数据、文件绝对路径和文件名称等。也可以根据需要选择相关元数据信息的内容,只要满足后续处理需要,均在本专利技术的保护范围之内。S2、通过所述元数据信息计算所述待存储文件的指纹;进一步地,所述指纹为对应文件元数据信息的哈希值;哈希值是一段数据唯一且极其紧凑的数值表示形式。如果散列一段明文而且哪怕只更改该段落的一个字母,随后的哈希都将产生不同的值。要找到散列为同一个值的两个不同的输入,在计算上来说基本上是不可能的。哈希值是根据文件的内容的数据通过逻辑运算得到的数值,不同的文件(即使是相同的文件名)得到的哈希值是不同的,所以哈希值值就成了每一个文件的身份证。不同哈希值的文件被认为是不同的文件,相同的哈希值的文件的内容肯定是完全相同(即使文件名不同)。HASH值还有文件校验的功能,相当于文件的校验码。因此通过哈希值判断文件信息是否一致具有明显的可行性。本实施例中,通过哈希算法计算得出对应文件元数据信息的哈希值。哈希算法将任意长度的二进制值映射为较短的固定长度的二进制值,这个小的二进制值称为哈希值。哈希值是一段数据唯一且极其紧凑的数值表示形式。如果散列一段明文而且哪怕只更改该段落的一个字母,随后的哈希都将产生不同的值。要找到散列为同一个值的两个不同的输入,在计算上是不可能的,所以数据的哈希值可以检验数据的完整性。一般用于快速查找和加密算法。哈希表是根据设定的哈希函数H(key)和处理冲突方法将一组关键字映射到一个有限的地址区间上,并以关键字在地址区间中的象作为记录在表中的存储位置,这种表称为哈希表或散列,所得存储位置称为哈希地址或散列地址。作为线性数据结构与表格和队列等相比,哈希表无疑是查找速度比较快的一种。通过将单向数学函数(有时称为“哈希算法”)应用到任意数量的数据所得到的固定大小的结果。如果输入数据中有变化,则哈希也会发生变化。哈希可用于许多操作,包括身份验证和数字签名。也称为“消息摘要”。或者说,哈希(Hash)算法,即散列函数。它是一种单向密码体制,即它是一个从明文到密文的不可逆的映射,只有加密过程,没有解密过程。同时,哈希函数可以将任意长度的输入经过变化以后得本文档来自技高网...

【技术保护点】
一种静态数据文件的存储方法,其特征在于,包括步骤:S1、获取待存储文件的元数据信息;S2、通过所述元数据信息计算所述待存储文件的指纹;S3、将所述待存储文件的指纹与已保存文件的指纹进行匹配,判断所述待存储文件的指纹是否存在;若存在,则返回所述已保存文件的指纹缓存并结束存储;若不存在,则缓存所述待存储的指纹缓存并结束存储。

【技术特征摘要】
1.一种静态数据文件的存储方法,其特征在于,包括步骤:
S1、获取待存储文件的元数据信息;
S2、通过所述元数据信息计算所述待存储文件的指纹;
S3、将所述待存储文件的指纹与已保存文件的指纹进行匹配,判断所述待存储文件的指
纹是否存在;若存在,则返回所述已保存文件的指纹缓存并结束存储;若不存在,则缓存所
述待存储的指纹缓存并结束存储。
2.根据权利要求1所述的静态数据文件的存储方法,其特征在于,所述元数据信息包括:
创建时间、修改时间、文件基本属性、文件自定义元数据、文件绝对路径和文件名称。
3.根据权利要求1所述的静态数据文件的存储方法,其特征在于,所述返回已保存文件
的指纹缓...

【专利技术属性】
技术研发人员:吴植民
申请(专利权)人:上海爱数信息技术股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1