一种采用分布式LSM树的RFID系统设计方法技术方案

技术编号：10877912 阅读：104 留言：0更新日期：2015-01-08 00:16

本发明专利技术提供一种采用分布式LSM树的RFID系统设计方法，RFID（RadioFrequencyIdentification）射频识别技术在近期呈现数据量明显增高的趋势，逐渐形成海量数据，具备大数据的特征。针对基于分布式LSM树的RFID系统实现，本发明专利技术的基本思想是：在分布式数据平台Hadoop上进行海量RFID数据冗余存储，并代替传统常用的B+树索引结构，使用一种新型的数据索引结构－LSM树，充分利用其基于内存的处理数据优势，进行海量RFID数据的实时校验存储。

全部详细技术资料下载

【技术实现步骤摘要】
一种采用分布式LSM树的RFID系统设计方法
本专利技术涉及计算机大数据
，具体地说是一种采用分布式LSM树的RFID系统设计方法。
技术介绍
RFID (Rad1 Frequency Identificat1n)射频识别技术，是一种快速的、非接触式的识别技术，基于低成本，易使用，技术成熟等特点，RFID技术已经被广泛应用到各个领域中。基于RFID技术的应用系统会实时产生大量数据，这些原始数据经由RFID阅读器交给数据处理系统，一方面此系统要对大量数据进行存储；另一方面还要对错误信息进行实时校验。这两方面都是目前亟待解决的问题。现有的海量数据管理技术部分是基于B+树的磁盘索引技术，B+树是一种高效的基于磁盘保存的数据结构，B+树虽然提供了快速的数据查找、快速的数据遍历，但B+树在读取期间会造成大量的磁盘随机1/0，在存取海量数据时，不能发挥其优势。所以，磁盘索引对于高实时性大吞吐量的RFID数据处理系统来说不能满足其高速存取要求。而在读取有复杂结构的RFID标签时，数据处理系统将面临很大的负载，往往不能达到实时性的要求。 LSM树就是将对数据的修改增量保持在内存中，达到指定的大小限制后将这些修改操作批量写入磁盘，读取时需要合并磁盘中的历史数据和内存中最近的修改操作。LSM树的优势在于有效地规避了磁盘随机写入问题。
技术实现思路
本专利技术的目的是提供一种采用分布式LSM树的RFID系统设计方法。本专利技术的目的是按以下方式实现的，在分布式数据平台Hadoop上进行海量RFID数据冗余存储，并代替传统常用的...

【技术保护点】
一种采用分布式LSM树的RFID系统设计方法, 其特征在于, 在分布式数据平台Hadoop上进行海量RFID数据冗余存储，并代替传统常用的B+树索引结构，使用LSM树数据索引结构，充分利用其基于内存的处理数据优势，进行海量RFID数据的实时校验存储,具体步骤如下：（1）搭建集群需要搭建集群，包括分布式数据平台和分布式数据库集群，首先根据集群机器的负载能力设置好数据块大小，配置好分布式数据平台主节点和从节点，当产生文件读写操作时，读写操作发起者Client和主节点、从节点进行RPC通信，三者共同使读写过程维持一致性，通过心跳机制检测着集群的运行状态，然后，将分布式数据库同样配置为主从结构，配置好Region大小，Hmaster和Regionserver相互通信，维持着分布式数据库系统的健壮性；（2）设计分布式存储表结构由于存储的是海量RFID数据，在数据库设计上首先考虑扩展性原则和实时存取原则，Hbase表结构是以按照列族为存储单位的，构建好集群后，首先简历表，再分别建立client，function，time，other四个列族，client列族对应着发起RFID操作的用户，funct...

【技术特征摘要】
1.一种采用分布式LSM树的RFID系统设计方法，其特征在于，在分布式数据平台Hadoop上进行海量RFID数据冗余存储，并代替传统常用的B+树索引结构，使用LSM树数据索引结构，充分利用其基于内存的处理数据优势，进行海量RFID数据的实时校验存储，具体步骤如下: (1)搭建集群需要搭建集群，包括分布式数据平台和分布式数据库集群，首先根据集群机器的负载能力设置好数据块大小，配置好分布式数据平台主节点和从节点，当产生文件读写操作时，读写操作发起者Client和主节点、从节点进行RPC通信，三者共同使读写过程维持一致性，通过心跳机制检测着集群的运行状态，然后，将分布式数据库同样配置为主从结构，配置好Reg1n大小，Hmaster和Reg1nserver相互通信,维持着分布式数据库系统的健壮性；...

【专利技术属性】
技术研发人员：王闯，李克学，戴鸿君，于治楼，
申请(专利权)人：浪潮集团有限公司，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人