数据存储和读取方法、装置及系统制造方法及图纸

技术编号：14563094 阅读：114 留言：0更新日期：2017-02-05 19:56

本发明专利技术公开了一种数据存储和读取方法、装置及系统。该数据读取方法包括：获取数据库中第一级关键词key对应的数据值value，获取第二级key；根据获取的参数N将第二级key分为N份，其中，每份第二级key对应一个计算单元的输入，N大于等于1且小于等于第二级key的个数；通过计算单元并发读取相应的第二级key所对应的value。借助于本发明专利技术的技术方案，扩展了hadoop MR的数据访问范围，将设置为二级模式的数据库也纳入了大数据处理范围中，使得hadoop MR能够直接大批量从数据库读取数据，提升了hadoopMR的运行效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据库
，特别是涉及一种数据存储和读取方法、装置及系统。
技术介绍
Hadoop是目前业界使用最多，最成熟的开源大数据存储和计算平台，它包含了很多组件，其中MapReduce(即MR)是hadoop平台上的编程模型。适用于大数据量下的分布式计算。Redis是一种开源的索引/值(key/value)内存数据库，支持多种数据格式的存储。HadoopMR提供了很多数据源的读取实现，如文件，hbase数据库等，但对直接从redis读取大批量数据并没有很好的支持，具体地，HadoopMR是大数据分布式计算的利器，输入一般是hdfs文件。redis是key/value的内存数据库，一般是根据单个key来读取单个value。因此目前缺少直接大批量从redis读取数据到hadoopMR的方式。
技术实现思路
鉴于上述问题，提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的数据存储和读取方法、装置及系统。本专利技术提供一种数据存储方法，包括：将数据库中的关键词key按照粒度大小分为两级，其中，粒度较大的第一级key对应的数据值value为粒度较小的第二级key；将需要存储的数据作为第二级key的value保存。本专利技术还提供了一种数据读取方法，用于Hadoop编程模型MR从数据库读取数据，包括：获取数据库中第一级关键词key对应的数据值value，获取第二...

【技术保护点】
一种数据存储方法，其特征在于，包括：将数据库中的关键词key按照粒度大小分为两级，其中，粒度较大的第一级key对应的数据值value为粒度较小的第二级key；将需要存储的数据作为第二级key的value保存。

【技术特征摘要】
1.一种数据存储方法，其特征在于，包括：
将数据库中的关键词key按照粒度大小分为两级，其中，粒度较大的第一
级key对应的数据值value为粒度较小的第二级key；
将需要存储的数据作为第二级key的value保存。
2.如权利要求1所述的方法，其特征在于，所述粒度大小包括：时间范
围的大小。
3.如权利要求1所述的方法，其特征在于，所述数据库为Redis数据库。
4.一种数据读取方法，用于Hadoop编程模型MR从数据库读取数据，其
特征在于，包括：
获取数据库中第一级关键词key对应的数据值value，获取第二级key；
根据获取的参数N将所述第二级key分为N份，其中，每份第二级key
对应一个计算单元的输入，所述N大于等于1且小于等于第二级key的个数；
通过计算单元并发读取相应的第二级key所对应的value。
5.如权利要求4所述的方法，其特征在于，所述获取的参数N具体包括：
根据执行并发计算的计算单元的个数，确定参数N。
6.一种数据存储装置，其特征在于，包括：
分级模块，用于将数据库中的关键词key按照粒度大小分为...

【专利技术属性】
技术研发人员：严峰，
申请(专利权)人：青岛海尔智能家电科技有限公司，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人