一种新型的KV分布式数据存储方法技术

技术编号：12277362 阅读：50 留言：0更新日期：2015-11-05 03:21

本发明专利技术公开了一种新型的KV分布式数据存储方法，包括如下步骤：S1分布化存储，将每一行数据分为定性字段及定量字段，分别把定性字段构成的表称为键表，把定量字段构成的表称为值表，并在两个表之间引入中间Key，S2对分布化存储的数据进行查询操作，本发明专利技术通过结合SQL与KV的优点，解决在实际应用中，当数据的结构和规模复杂而又庞大时，单一使用SQL存储和KV存储都不能满足实际需要的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种分布式的存储系统，特别涉及一种新型的KV分布式数据存储方法。
技术介绍
关系型数据库是支持关系模型的数据库，是目前使用最广泛的数据库系统，其中结构化查询语言SQL是最重要的关系数据库操作语言，SQL语言简洁、简单好学，有强大的数据分析能力（分组、联表、嵌套查询等），大部分数据都可以很方便地写入关系型数据库中，也可以用SQL强大的表达能力进行多方面数据处理与分析，从而大大简化系统的复杂度和开发部署难度，因此也使其应用相当广泛。对于数据量不大，例如千万级的统计系统， SQL是相对比较好的解决方案。但对于海量的存储系统，SQL单机运行的特性将成为整个系统的瓶颈，主要表现在容量和速度两个方面。若继续使用关系型数据库，其付出的硬件和运行维护的成本要远远高出其带来的便利性。键-值（Key-Value)存储型数据库是非关系数据库中应用较广的一种。典型的 KV存储系统可以说与关系型数据库完全相反，不支持复杂表结构，不支持复杂查询，但易扩展、查询速度快、支持大数据量高速写入查询等特点，这也是在海量信息时代KV系统越来越多的被使用的原因。但是典型KV系统更多的侧重在Key与Value的存储，而有时候我们也还需要关注Key本身的一些信息，例如要按"学院+年级+课程"统计学生及格率，如何罗列这些所有的组合呢？如果是用SQL系统，那么用GROUPBY语句就能完成要求。而在KV 的情况下，显然"学院+年级+课程"的每一个组合都对应一个Key，通过枚举所有的组合并不是一个可行的方案，因为"学院+年级+课程"都是在不断变化的，所以...

【技术保护点】
一种新型的KV分布式数据存储方法，其特征在于，包括如下步骤：S1分布化存储，具体为：将每一行数据分为定性字段及定量字段，然后对数据表按照定性字段及定量字段进行拆分，由定性字段构成的表称为键表即KT，定量字段构成的表称为值表即VT，并在两个表之间引入中间Key,将KT、中间key保存在关系型数据表中，VT保存在KV存储系统中，进而完成了整个系统的分布化存储；S2对分布化存储的数据进行查询操作，包括如下步骤：S2.1查询键表，得到定性字段的关系表及中间key列表；S2.2查询值表，具体为，在KV存储系统中，Key和存储节点是固定映射关系，根据该映射关系将中间key列表按照存储节点并行下发到各个数据存储节点进行查询，得到数据集；S2.3根据中间Key列表对关系表和数据集进行联合，得到合并表；S2.4在合并表上做分组及汇总操作。

【技术特征摘要】

【专利技术属性】
技术研发人员：邓晓燕，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人