采用HASH链存储数据的方法及数据写入、读取方法技术

技术编号:28128522 阅读:47 留言:0更新日期:2021-04-19 11:46
本发明专利技术涉及一种采用HASH链存储数据的方法及数据写入、读取方法,其中,存储数据的方法步骤包括穷举固定长度的所有数据块,采用HASH算法计算所有标准数据块的HASH值,形成具有若干HASH值的索引表,并且使待存储的数据文件在存储系统内以其所包含的标准数据块的HASH索引链的形态进行存储。本发明专利技术在对数据文件的读写处理时均只对文件的HASH索引链操作,从而降低数据文件在系统内实际存储容量的同时,还可提高数据读写效率;同时,于系统内或系统间进行数据传递,均仅需传递数据HASH索引链记录,从而降低系统内、系统间数据传输的带宽需求;此外,便于灵活地在分布式系统中部署,易于构建分布式、大规模的存储系统。大规模的存储系统。大规模的存储系统。

【技术实现步骤摘要】
采用HASH链存储数据的方法及数据写入、读取方法


[0001]本专利技术涉及计算机存储
,尤其涉及一种采用HASH链存储数据的方法以及数据写入方法、数据读取方法。

技术介绍

[0002]计算机存储技术的发展需要基于计算机硬件系统的存储单元,而我们所熟知的计算机硬件系统一般则由运算器、控制器、存储器、输入和输出设备构成,存储性能优劣受到多方面的影响,其中即包括存储单元的存储容量与存储方式。对于日益复杂的大数据应用及快速增长的数据量,存储设备的性能、容量乃至数据传输带宽在现代计算机系统中都捉襟见肘,逐渐成为整个计算机系统的发展瓶颈。
[0003]其中,存储容量会直接关系到存储系统的性能优劣,主要原因在于,随着计算机CPU运算性能的不断加强,CPU性能已经超过了内存系统能够满足的范围,另一方面,多媒体、面向对象数据库、Web服务器等大量应用使得内存要求迅速增加,与处理器高速发展不相适应的内存系统已经限制了许多应用领域,并且这一制约效果还在继续增大,这一事实说明,若无法解决内存系统的性能瓶颈问题,单纯地继续提高机器主频和算术逻辑功能,其投本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种采用HASH链存储数据的方法,其在进行数据存储之初,首先于计算机系统内生成并保存一份标准数据块,再引入HASH算法针对标准数据块进行相应的计算,其特征在于,所述采用HASH链存储数据的方法包括以下步骤:穷举固定长度的所有数据块,采用HASH算法计算所有标准数据块的HASH值,形成具有若干HASH值的索引表,并且使待存储的数据文件在存储系统内以其所包含的标准数据块的HASH索引链的形态进行存储;其中,若计算出的HASH值有冲突,需对HASH值冲突的数据块进行编号、保存、记录。2.根据权利要求1所述的采用HASH链存储数据的方法,其特征在于:针对HASH值冲突的数据块进行编号、保存之后,记录于由HASH值索引的记录里。3.根据权利要求1所述的采用HASH链存储数据的方法,其特征在于:其中,若计算出的HASH值有冲突,可对该数据块再次采用正交的HASH算法,计算两个HASH值进行区分。4.根据权利要求1

3任一项所述的采用HASH链存储数据的方法,其特征在于:所述数据文件在存储系统中仅保存表示数据块顺序的HASH索引链以及必要的算法信息。5.根据权利要求4所述的采用HASH链存储数据的方法,其特征在于:采用该方法于系统内或系统间进行数据传递,均仅需传递数据HASH索引链记录。6.根据权利要求1

3任一项所述的采用HASH链存储数据的方法,其特征在于,于并发性要求高的系统中进行数据存储的步骤包括,可在一个节点内生成多份标准数据块HASH索引表或者分布式部署在多个节点上,各节点的标准数据块HASH索引表无需进行任何较验操作。7.一种数据写入方法,其适用于采...

【专利技术属性】
技术研发人员:蔡云霞
申请(专利权)人:深圳创新科技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1