一种基于实时归并的海量小文件存储性能优化方法及装置制造方法及图纸

技术编号：27481066 阅读：30 留言：0更新日期：2021-03-02 17:52

本发明专利技术提出了一种基于实时归并的海量小文件存储性能优化方法及装置，涉及计算机存储领域。其中包括一种基于实时归并的海量小文件存储性能优化方法及装置：接收客户端发送的文件数据存储请求，将待存储文件通过对象存储的方式分层写入SSD、HDD存储资源池中；其中，所述待存储文件为大文件时存放到所述HDD存储资源池，所述待存储文件为小文件时存放到所述SSD存储资源池，在文件索引池中存放该文件的元数据信息；根据所述元数据信息生成文件的全局唯一标识key。本发明专利技术能够提升小文件写入速度，并且实现对海量小文件的合理存储。且实现对海量小文件的合理存储。且实现对海量小文件的合理存储。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于实时归并的海量小文件存储性能优化方法及装置

[0001]本专利技术涉及计算机存储领域，具体而言，涉及一种基于实时归并的海量小文件存储性能优化方法及装置。

技术介绍

[0002]伴随互联网、物联网、云计算、大数据等行业的迅速发展，音视频、图片、日志等各类文件数量均呈现指数型增长，终端设备需要不间断的上传大量文件，其中1M以下小文件的数量往往会达到百万级、千万级甚至亿级，此类文件被定义为海量小文件。海量小文件对终端设备的写入性能要求较高，对读取性能要求较低，如何对海量小文件进行合理存储对当前大数据时代可持续发展意义重大。
[0003]传统的文件存储系统主要基于树状目录层级结构，可扩展性有限。并且，海量小文件会导致目录树深度增大，严重影响了目录树的均衡效率，当出现大规模并发时，访问性能有限。此外，当前存储小文件一般使用的是HDD磁盘。因此，目前需要一种能够解决现有文件存储目录树不适合大规模文件存储以及HDD磁盘小文件存储效率低的问题。

技术实现思路

[0004]本专利技术的目的在于提供一种基于实时归并的海量小文件存储性能优化方法，其能够实现对海量小文件的合理存储，并且提高小文件的存储效率。
[0005]本专利技术的另一目的在于提供一种基于实时归并的海量小文件存储性能优化方装置，其能够实现对海量小文件的合理存储，提高大量用户并发访问时的访问效率。
[0006]本专利技术的实施例是这样实现的：第一方面，本申请实施例提供一种基于实时归并的海量小文件存储性能优化方法，包括S1：接收客...

【技术保护点】

【技术特征摘要】
1.一种基于实时归并的海量小文件存储性能优化方法，其特征在于，包括S1：接收客户端发送的文件数据存储请求，将待存储文件通过对象存储的方式分层写入SSD、HDD存储资源池中；其中，所述待存储文件为大文件时存放到所述HDD存储资源池，所述待存储文件为小文件时存放到所述SSD存储资源池，在文件索引池中存放该文件的元数据信息；根据所述元数据信息生成文件的全局唯一标识key；S2：设定小文件归并数量的阈值和归并字节总数的阈值，当SSD存储资源池中存放所述小文件的所述归并数量或者所述字节总数超出阈值时，实时触发服务器的文档归并流程，服务器后台提取已有的所述小文件的内容归并成一个大文件，将所述大文件存储至所述HDD存储资源池；S3：所述小文件归并归档后，根据标识key映射到文件索引池中的元数据信息增加数据定位信息；S4：更新完所述小文件的所述元数据信息后，删除所述SSD数据池中被归并的所述小文件；S5：服务器接收客户端发送的所述文件数据访问请求，如果所述元数据信息中不存在所述数据定位信息，则根据所述元数据信息解析出所述标识key，通过所述标识key从所述SSD存储资源池中访问对应的文件内容；如果所述元数据信息存在所述数据定位信息，根据所述数据定位信息从所述HDD存储资源池中找到所述小文件归并后的所述大文件，再从所述大文件中提取所述小文件的文件内容。2.如权利要求1所述一种基于实时归并的海量小文件存储性能优化方法，其特征在于，步骤S1中包含：所述元数据信息包括文件身份标识号、文件生成的时间节点、文件大小和文件类型中的任意一项或多项。3.如权利要求1所述一种基于实时归并的海量小文件存储性能优化方法，其特征在于，步骤S1中包含：根据所述待存储文件的所述元数据信息，按“身份标识号+文件生成时间”拼接字符串生成文件的所述标识key。4.如权利要求1所述一种基于实时归并的海量小文件存储性能优化方法，其特征在于，步骤S1中包含：设置文件的分层字节数的阈值，当所述待存储文件的所述分层字节数大于阈值时，判定所述待存储文件为大文件，否则判定所述待存储文件为小文件。5.如权利要求4所述一种基于实时归并的海量小文件存储性能优化方法，其特征在于，设置文件的所述分层字节数阈值为1M。6.如权利要求1所述一种基于实时归并的海量小文件存储性能优化方法，其特征在于，步骤S1中包含：根据文件内容生成与所述标识key对应的value；所述标识key的value一一映射，通过...

【专利技术属性】
技术研发人员：杨鹏，杨波，
申请(专利权)人：南京群顶科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人