基于HBASE键值索引的复杂类型编码序列化算法的实现方法技术

技术编号:19479898 阅读:34 留言:0更新日期:2018-11-17 10:31
本发明专利技术的基于HBASE键值索引的复杂类型编码序列化算法的实现方法,对rowkey中整型和浮点型等数值的二进制字节码进行特定的序列化,使rowkey中复杂数值类型二进制字节码在序列化后保持与实际数值有相同的序关系,使其逻辑上连贯的数据在物理存储上也保持连贯有序且一一对应,提高Hbase范围查询效率,同时对于扩展优化Hbase rowkey复杂类型键值索引研究也有重大的借鉴意义。

【技术实现步骤摘要】
基于HBASE键值索引的复杂类型编码序列化算法的实现方法
本专利技术属于计算机领域,涉及一种基于HBASE键值索引的复杂类型编码序列化算法的实现方法。
技术介绍
本专利技术所要研究的两种复杂类型编码序列化算法包括整型和浮点型,整型数值大小与对应字节编码值(补码)之间序关系见图1a;浮点型数值大小与对应字节编码值(IEEE754下)之间序关系见图1b;无论是单精度还是双精度在存储中都分为三个部分:一、符号位(Sign):0代表正,1代表为负;二、指数位(Exponent):用于存储科学计数法中的指数数据,并且采用移位存储;三、尾数部分(Mantissa):尾数部分。Hbase是三维有序存储,分别为rowkey(行主键),columnkey(columnFamily+qualifier),timestamp(时间戳)。rowkey是行的主键,而且HBASE只能用一个rowkey,或者一个rowkey范围即scan来查找数据。所以rowkey的设计是至关重要的,关系到应用层的查询效率。rowkey是按照所存储数据二进制字节编码的字典序进行排序,即rowkey的ASCII码次序升序排列,如字本文档来自技高网...

【技术保护点】
1.基于HBASE键值索引的复杂类型编码序列化算法的实现方法,其特征在于:预先对复杂类型编码对应的二进制字节码进行序列化处理,使复杂数值类型对应的二进制字节码值在序列化后与实际数值保持相同连续的序关系,使得逻辑上连贯的复杂类型数据在Hbase rowkey的物理存储和排序上也保持相同的序关系。

【技术特征摘要】
1.基于HBASE键值索引的复杂类型编码序列化算法的实现方法,其特征在于:预先对复杂类型编码对应的二进制字节码进行序列化处理,使复杂数值类型对应的二进制字节码值在序列化后与实际数值保持相同连续的序关系,使得逻辑上连贯的复杂类型数据在Hbaserowkey的物理存储和排序上也保持相同的序关系。2.如权利要求1所述的基于HBASE键值索引的复杂类型编码序列化算法的实现方法,其特征在于:复杂类型编码包括整型和浮点型两种复杂数值类型,在IEEE754标准下对两种复杂数值类型的编码格式和对应的二进制字节码值分别进行序列化处理;对于整型数编码序列化算法步骤如下:1)首先获取整型数编码对应的二进制字节码;2)将该字节...

【专利技术属性】
技术研发人员:齐勇李晓宇侯迪王培健
申请(专利权)人:西安交通大学
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1