基于云计算的大数据检索方法技术

技术编号：12624604 阅读：83 留言：0更新日期：2015-12-31 17:58

本发明专利技术提供了一种基于云计算的大数据检索方法，该方法包括：将云存储系统的索引结构分为主索引和本地索引两级，将数据内容存储于本地索引中，并在主索引中利用链式队列为所有的本地索引发布的元数据建立索引，通过元数据的关联实现检索。本发明专利技术提出了一种数据检索方法，有效支持多种形式的检索，可扩展性强，改善了主索引的并发性，动态实时性好，保证了索引结构整体负载均衡。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据处理，特别涉及一种。
技术介绍
云计算系统能够提供海量存储、可靠服务，因此日益受到重视。在云基础设施中，由成千上万台互相连接在一起的计算机构成提供服务的“云”，大量的用户可以同时共享这块“云”，并根据自己的实际需求对所需资源进行剪裁。作为云数据处理中的一个重要组成部分，当前的云存储系统绝大部分都采用分布式散列表的方式来构建索引，数据被组织成键值对的形式。因此，这类云存储系统只支持关键字查找，并通过点式检索来访问数据。然而，在对于如今发展起来的大数据的实际应用中，用户可能倾向于采用多个键值来进行多维度检索，此时现有的解决方案只能通过运行一个后台批处理任务来扫描整个数据集然后得到检索结果。然而，这类解决方案缺乏实时性，新存入的数据元组不能被及时地检索到，必须等到后台的批处理任务完成扫描才可被检索。
技术实现思路
为解决上述现有技术所存在的问题，本专利技术提出了一种，包括:—种，其特征在于，包括:将云存储系统的索引结构分为主索引和本地索引两级，将数据内容存储于本地索引中，并在主索引中利用链式队列为所有的本地索引发布的元数据建立索引，通过元数据的关联实现检索。优选地，所述将云存储系统的索引结构分为主索引和本地索引两级，进一步包括:I)对下级的云存储系统的存储空间进行划分，按照等量和有序的原则设定好各本地索引管理的空间范围；2)按照步骤I)分配好的本地索引管理的空间范围，将云存储系统中的数据映射到对应的本地索引中，当映射过程完成以后，各本地索引内部以及各本地索引之间均为有序;3)下级的各本地索引分别将其最高级的节点发布到上级的主索引中，主...

【技术保护点】
一种基于云计算的大数据检索方法，其特征在于，包括：将云存储系统的索引结构分为主索引和本地索引两级，将数据内容存储于本地索引中，并在主索引中利用链式队列为所有的本地索引发布的元数据建立索引，通过元数据的关联实现检索。

【技术特征摘要】

【专利技术属性】
技术研发人员：赖真霖，文君，
申请(专利权)人：成都四象联创科技有限公司，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人