【技术实现步骤摘要】
使能HADOOP分布式文件系统的扩展的可扩展基于树的索引框架
本公开涉及用于改进分布式处理系统的文件系统容量的技术。
技术介绍
执行“大数据”操作的技术有规律地使用Apache™Hadoop®分布式文件系统平台或其它分布式文件系统来管理其数据。分布式文件系统在大数据操作中是有用的,因为它们使能从多种多样的应用和客户端装置对数据的远程访问和共享访问,并且能够处理大量的数据。在诸如无人驾驶车的新兴自动化领域中,需要管理比以前更多的数据。然而,传统的数据管理系统在能够被管理的文件的数量方面受现有架构约束。此类约束当前限制了技术发展。附图说明从与要求保护主题一致的实施例的下面详细描述中,将明白要求保护的主题的特征和优点,该描述应参照附图来考虑,其中:图1图示了与本公开的若干实施例一致、具有可支持分布式处理系统的文件系统框架的数据管理系统的功能框图;图2图示了与本公开的若干实施例一致、具有可支持分布式处理系统的文件系统框架的数据管理系统的功能框图;图3是与本公开的若干实施例一致、用于具有可支持分布式处理系统的文件系统框架的数据管理系统的操作的过程的流程图;图4是与本公开的若干实施例一致、用于提供使能文件系统的扩展的基于树的索引框架的过程的流程图。虽然以下详细描述将参照说明性实施例继续,但其许多备选、修改和变化将对本领域技术人员显而易见。具体实施方式系统、设备和/或方法提供可支持用于诸如Apache™Hadoop®的分布式数据处理系统的数据管理的文件系统。文件系统可包括可扩展的基于树的索引框架,其使能文件系统的方便扩展。作为非限制性示例,本文中公开的文件系统可使能十亿 ...
【技术保护点】
1. 一种文件系统,包括:保持根索引的根索引逻辑,所述根索引将多个文件参考关联到多个叶索引参考,其中所述多个文件参考表示多个文件,并且所述多个叶索引参考表示多个叶索引,其中所述根索引和所述多个叶索引是树数据结构,其中所述根索引是所述树数据结构中的父节点,并且所述多个叶索引的每个是所述树数据结构中的子节点;以及保持所述多个叶索引之一的叶索引逻辑,所述多个叶索引的所述之一将所述多个文件参考的至少一个关联到一个或多个数据存储装置中的至少一个块位置,所述叶索引逻辑要响应来自一个或多个客户端装置的、访问与所述多个文件参考的所述至少一个关联的数据文件的一个或多个请求,将所述至少一个块位置传递到所述一个或多个客户端装置。
【技术特征摘要】
2017.12.19 US 15/8473361.一种文件系统,包括:保持根索引的根索引逻辑,所述根索引将多个文件参考关联到多个叶索引参考,其中所述多个文件参考表示多个文件,并且所述多个叶索引参考表示多个叶索引,其中所述根索引和所述多个叶索引是树数据结构,其中所述根索引是所述树数据结构中的父节点,并且所述多个叶索引的每个是所述树数据结构中的子节点;以及保持所述多个叶索引之一的叶索引逻辑,所述多个叶索引的所述之一将所述多个文件参考的至少一个关联到一个或多个数据存储装置中的至少一个块位置,所述叶索引逻辑要响应来自一个或多个客户端装置的、访问与所述多个文件参考的所述至少一个关联的数据文件的一个或多个请求,将所述至少一个块位置传递到所述一个或多个客户端装置。2.如权利要求1所述的文件系统,其中所述根索引逻辑要:从所述一个或多个客户端装置接收对所述一个或多个数据存储装置的访问请求;确定所述多个叶索引的那些管理与所述访问请求关联的所述一个或多个存储装置;以及响应所述接入请求,向所述一个或多个客户端装置提供用于管理与所述访问请求关联的所述一个或多个存储装置的所述多个叶索引的地址信息。3.如权利要求2所述的文件系统,其中所述叶索引逻辑要:从所述一个或多个客户端装置接收对所述一个或多个数据存储装置的访问请求;确定一个或多个块文件的哪个响应所述访问请求;以及响应所述接入请求,向所述一个或多个客户端装置提供用于具有响应所述访问请求的所述一个或多个块文件的所述一个或多个存储装置的地址信息。4.如权利要求1所述的文件系统,其中所述根索引逻辑要:从所述一个或多个客户端装置接收对所述多个文件的至少一个的访问请求;确定所述多个叶索引的哪些管理所述访问请求的所述多个文件的所述至少一个;以及响应所述接入请求,向所述一个或多个客户端装置提供用于管理所述访问请求的所述多个文件的所述至少一个的所述多个叶索引的地址信息。5.如权利要求4所述的文件系统,其中所述叶索引逻辑要:从所述一个或多个客户端装置接收对所述多个文件的所述至少一个的访问请求;确定所述一个或多个存储装置的哪个包括存储所述多个文件的所述至少一个的块文件;以及向所述一个或多个客户端装置提供用于具有存储所述多个文件的所述至少一个的所述块文件的所述一个或多个存储装置的地址信息。6.如权利要求1所述的文件系统,其中所述根索引要将所述多个文件参考关联到所述多个叶索引参考包括:所述根索引要将所述叶索引参考的每个映射到所述多个文件参考的子集。7.如权利要求1所述的文件系统,其中所述根索引保持所述多个文件参考的目录,所述目录包括根节点和多个子目录子节点,其中包括所述多个文件参考的至少一个的所述多个子目录子节点的每个被指派到所述多个叶索引之一,并且包括所述多个叶索引参考之一。8.如权利要求1所述的文件系统,其中所述根索引是在Apache™Hadoop®文件系统内可操作的根名称节点。9.如权利要求1所述的文件系统,其中所述多个叶索引的每个是在Apache™Hadoop®文件系统内可操作的叶名称节点。10.如权利要求1所述的文件系统,其中所述多个叶索引的每个由多个叶索引系统之一托管,所述叶索引系统各自包括叶节点逻辑以保持在所述多个文件参考的子集与所述一个或多个数据存储装置内的至少一个块位置之间的关联。11.如权利要求1所述的文件系统,其中所述根索引逻辑在所述文件系统的操作期间要被复制到随机存取存储器。12.如权利要求1所述的文件系统,其中所述多个叶索引的每个由多个叶索引系统之一托管,所述叶索引系统各自包括叶节点逻辑以将心跳信息传送到所述根索引逻辑,其中所述根索引逻辑要至少部分基于所述心跳信息来更新所述根索引。13.如权利要求1所述的文件系统...
【专利技术属性】
技术研发人员:UMR甘古马拉,M班达鲁,R拉达克里希南波蒂,D卡瓦利,N拉伊,
申请(专利权)人:英特尔公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。