一种用于多文件的存储方法技术

技术编号：11731874 阅读：321 留言：0更新日期：2015-07-15 03:56

本发明专利技术提供了一种用于多文件的存储方法，用于在云存储平台中对文件进行处理，所述云存储平台包括用户接口层，业务逻辑层和存储层，所述业务逻辑层将低于预设大小的文件进行合并，然后建立文件索引，将存储层构建在分布式文件系统上，为用户提供文件读取和写入接口。本发明专利技术在大量小文件的读写的情况下保持了云存储平台的响应速度和分布式文件系统整体性能。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据存储，特别涉及一种大数据的多文件存储方法。
技术介绍
随着智慧医疗的迅速发展和海量医学数据的出现，需要相应的大型数据库作为载体来保存这些数据，但大数据的调度成了一个大问题。医学界的文件检索数量随着网络资源也呈指数级增长，尤其是小文件的更新速度和累积量都不断提升,已经成为医疗云存储亟待解决的问题。尽管分布式文件系统已经被广泛应用于大规模数据的存储、分析中，很多机构都已采用分布式文件系统来解决快速增长的数据问题。然而现有分布式文件系统的设计主要针对大文件的读写，大量小文件的存储会降低文件系统整体性能，不能被很好地应用在医学检索等以小文件存储为主的系统中。因此，针对相关技术中所存在的上述问题，目前尚未提出有效的解决方案。
技术实现思路
为解决上述现有技术所存在的问题，本专利技术提出了一种用于多文件的存储方法，用于在云存储平台中对文件进行处理，所述云存储平台包括三层结构，即用户接口层，业务逻辑层和存储层，其特征在于，所述业务逻辑层首先将低于预设大小的文件进行合并，然后建立文件索引，将存储层构建在分布式文件系统上，为用户提供文件读取和写入接口。优选地，所述分布式文件系统采用将Web服务器和服务器集群分离的方式，并且所述用户接口层即提供的用户界面，用于使用户发送请求和接收反馈信息；所述文件索引包括资源集合主索引和资源条目次索引，主索引数据存储在关系数据库中，通过关系数据库访问接口提供访问，使用Java中的Map数据结构保存，在资源集合已经写入数据库的基础上，增加在资源条目添加时由系统生成值的字段，...

【技术保护点】
一种用于多文件的存储方法，用于在云存储平台中对文件进行处理，所述云存储平台包括三层结构，即用户接口层，业务逻辑层和存储层，其特征在于：所述业务逻辑层首先将低于预设大小的文件进行合并；建立文件索引，将所述存储层构建在分布式文件系统上，为用户提供文件读取和写入接口。

【技术特征摘要】
1.一种用于多文件的存储方法，用于在云存储平台中对文件进行处理，所述云
存储平台包括三层结构，即用户接口层，业务逻辑层和存储层，其特征在于：
所述业务逻辑层首先将低于预设大小的文件进行合并；
建立文件索引，将所述存储层构建在分布式文件系统上，为用户提供文件读取
和写入接口。
2.根据权利要求1所述的方法，其特征在于，所述分布式文件系统采用将Web
服务器和服务器集群分离的方式，并且所述用户接口层即提供的用户界面，用
于使用户发送请求和接收反馈信息；
所述文件索引包括资源集合主索引和资源条目次索引，主索引数据存储在关系
数据库中，通过关系数据库访问接口提供访问，使用Java中的Map数据结构保
存，在资源集合已经写入数据库的基础上，增加在资源条目添加时由系统生成
值的字段，主索引中的数据采用Key/Value结构，使用Java中Map数据结构，
在服务启动的时候根据数据库中内容初始化该Map对象并一直存在，当有新的
资源集合加入或有的被删除的时候，对该Map对象进行更新；次索引是通过开
源项目Lucene创建的，支持小文件元数据检索，每当用户添加资源条目的时候
实时更新索引文件；多个用户在一个资源集合下同时添加资源条目时，实现文
件写入的并发控制；
所述将文件进行合并进一步包括：创建SequenceFile对象，通过过滤器的过滤，
对符合预设条件的文件进行合并，根据资源条目所在的资源集合在主索引中查
找，查找到资源集合对应的文件路径后，创建SequenceFile对象，并获得
SequenceFile的Writer对象并对其进行配置，准备写入文件，在执行文件写入
的同时开启一个新的线程，将该资源条目对应的文件位值、长度信息写入资源
条目次索引，资源条目写入成功后关闭输出流，返回提交成功，否则返回提交

\t失败。
3.根据权利要求1所述的方法，其特征在于，所述业务逻辑层还包括分布式系
统客户端，其封装了操作文件系统与外界交互的API,当文件系统接收到文件读
取请求时，首先经过文件过滤器进行判断，若属于被合并的文件则首先在缓存
中查找文件的元数据信息，若不存在元数据信息，则在索引文件中进行查找，
若在索引文件中查找不到则与名字节点通信，在査找到文件元数据后构建
SequenceFile对象，然后获得SequenceFile的Reader对象向数据节点发送读
取请求，将数据传输给用户后关闭输入流。
4....

【专利技术属性】
技术研发人员：刘颖，
申请(专利权)人：成都汇智远景科技有限公司，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人