The invention provides a multi-dimensional hierarchical hash encoding and decoding method and apparatus, storage medium, the encoding method includes the data according to time periodic classification; data sparse filter on the time period, generation of multi-dimensional data; the dimension data in accordance with the size of data are sorted and stored according to the data storage location computation. Hashige; each hash value corresponding to each cycle rank size according to the amount of data to obtain a hash table, and storage. The present invention is optimized with I/O storage method, can greatly save the storage space. The hash table, which is multidimensional periodic hash coding and hash table, can be used to locate data location and read data parallel, and improve data reading speed.
【技术实现步骤摘要】
多维分级哈希编码、解码方法与设备、存储介质
本专利技术涉及数据存储管理领域,特别涉及一种时间序列相关数据的多维分级哈希编码、解码方法与设备、存储介质。技术背景云存储和大数据背景下,数据呈现爆炸式增长趋势。根据研究显示,2020年数字宇宙将达到35.2ZB,比2009年的0.8ZB猛增44倍,这其中80%以上为非结构化数据。金融领域、国民经济宏观控制、区域综合发展规划、企业经营管理、市场潜量预测、气象预报、水文预报、地震前兆预报、农作物病虫灾害预报、环境污染控制、生态平衡、天文学和海洋学等等大量数据密集型应用导致数据的井喷。因数据存储量巨大,导致读写速度很慢,其主要问题是存储与I/O没有做到很好的优化,故不断对存储方法提出新的严峻挑战。
技术实现思路
本专利技术提供一种多维分级哈希编码、解码方法与设备、存储介质,通过优化存储方法与I/O,很好地解决上述数据读写速度慢的问题,同时降低数据存储使用空间。本专利技术提供了一种多维分级哈希编码方法,包括如下步骤:数据输入;将数据按照时间周期进行分类;对各时间周期相关数据进行稀疏滤波,生成多维数据;对各维数据按照数据量大小进行排序并存储,根据数据存储位置计算生成哈希值;将各个周期对应的每组哈希值按照数据量大小进行排序,获得哈希表并存储。所述的稀疏滤波是将数据相同值进行删除的压缩方法,在一组时间相关序列值中,检测相邻的值是否相同,如果相同则删除相邻的相同值。所述的哈希表包含二级或二级以上数据结构。所述的时间周期包括但不限于年、月、周、日、时、30分钟、5分钟、5秒、1秒、1跳。所述的哈希值用于标识所述数据的位置,每个哈希 ...
【技术保护点】
一种多维分级哈希编码方法,适于在计算设备中执行,包括以下步骤:数据输入;将数据按照时间周期进行分类;对各时间周期相关数据进行稀疏滤波,生成多维数据;对各维数据按照数据量大小进行排序并存储,根据数据存储位置计算生成哈希值;将各个周期对应的每组哈希值按照数据量大小进行排序,获得哈希表并存储。
【技术特征摘要】
1.一种多维分级哈希编码方法,适于在计算设备中执行,包括以下步骤:数据输入;将数据按照时间周期进行分类;对各时间周期相关数据进行稀疏滤波,生成多维数据;对各维数据按照数据量大小进行排序并存储,根据数据存储位置计算生成哈希值;将各个周期对应的每组哈希值按照数据量大小进行排序,获得哈希表并存储。2.如权利要求1所述的方法,其特征在于,所述的稀疏滤波是将数据相同值进行删除的压缩方法,在一组时间相关序列值中,检测相邻的值是否相同,如果相同则删除相邻的相同值。3.如权利要求1所述的方法,其特征在于,所述的哈希表包含二级或二级以上数据结构。4.如权利要求1所述的方法,其特征在于,所述的时间周期包括但不限于年、月、周、日、时、30分钟、5分钟、5秒、1秒、1跳。5.如权利要求1所述的方法,其特征在于,所述的哈希值用于标识所述数据的位置,每个哈希值标识了对应周期的数据位置。6.如权利要求1所述的方法,其特征在于,所述的数据与时间序列相关,包括但不限于金融数据、国民经济宏观控制数据、区域综合发展规划数据...
【专利技术属性】
技术研发人员:陈盛福,李贵,
申请(专利权)人:上海宽全智能科技有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。