The data processing method, data processing device and electronic equipment provided in this application relate to the technical field of heterogeneous data storage. Among them, the data processing method includes: acquiring attribute information of the heterogeneous data to be processed, in which the heterogeneous data is composed of multiple groups of data; dividing and processing according to the attribute information to obtain multiple data levels, in which the corresponding data amount of each data level is different; generating a corresponding mapping relationship for each data level, and subordinating it to Each group of data at the same data level is stored based on the mapping relationship corresponding to the data level. By using the above method, the problem of waste of storage resources or unfavorable search after storage of heterogeneous data in the prior art can be improved.
【技术实现步骤摘要】
数据处理方法、数据处理装置和电子设备
本申请涉及异构化数据存储
,具体而言,涉及一种数据处理方法、数据处理装置和电子设备。
技术介绍
在工业IoT物联网环境中,散布在各个区域的IoT设备通常是属于某个具体的租户,而属于每个租户的IoT设备则可能会成千上万。并且,不同设备之间工况参数(如设备机械、电气和GPS位置属性等)的个数变化较大,从几个到几百个都有。作为最终用户登陆入口的SaaS系统,需要有效地管理这些多租户环境下的多设备,应用大数据OLAP技术去多维度、多参数地监控、统计和展示这些异构化数据。在面对上述应用需求时,现有技术中存在两种技术方案。例如,一种方案为:如果使用常见的关系数据库系统的话,一个IoT设备类型就创建一张数据库表(Table)。因此,在每个租户会有多种设备类型的基础上,每个租户名下就会有多张数据库表。按照这样的设计,每新增一种设备类型都需要创建一张新的数据库表,这样做的一个明显的后果就是如果按以租户、设备类型等为维度的进行查询,则演变为对多个表的关联操作,势必极大影响系统性能。或者,如果对这些设备类型表进行归纳,用一张大表或者少数几张表去映射这些设备,则这些表本质上就是这些设备属性的合集,这样一来,不少行的某些列的数值肯定是空,但数据库系统不得不为之占位,进而造成空间上的浪费。另外众所周知的是,一张表中如果有太多的数据条数会影响系统数据处理的性能。另一种方案为:用面向列存储的NoSQL系统,如MongoDB,去存这些异构化数据。由于是面向列存储系统设计,这些系统先天就具有schema-free优势,比较适合存贮字段变长或不固定的 ...
【技术保护点】
1.一种数据处理方法,其特征在于,包括:获取待处理的异构化数据的属性信息,其中,所述异构化数据由多组数据构成;根据所述属性信息进行等级划分处理得到多个数据等级,其中,各数据等级对应的数据量大小不同;对每一个所述数据等级生成对应的一个映射关系,并将属于相同数据等级的各组数据基于该数据等级对应的映射关系进行存储。
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取待处理的异构化数据的属性信息,其中,所述异构化数据由多组数据构成;根据所述属性信息进行等级划分处理得到多个数据等级,其中,各数据等级对应的数据量大小不同;对每一个所述数据等级生成对应的一个映射关系,并将属于相同数据等级的各组数据基于该数据等级对应的映射关系进行存储。2.根据权利要求1所述的数据处理方法,其特征在于,所述获取待处理的异构化数据的属性信息的步骤,具体为:针对待处理的异构化数据中的每一组数据,获取该组数据中各子数据具有的数据类型和每一种数据类型对应的子数据的数量,其中,每一组数据包括多个子数据。3.根据权利要求2所述的数据处理方法,其特征在于,所述数据类型包括字符串型、浮点型、长整型、日期型和布尔型中的至少一种。4.根据权利要求1-3任意一项所述的数据处理方法,其特征在于,所述获取待处理的异构化数据的属性信息的步骤,包括:在待处理的异构化数据中选择部分数据作为样本数据;获取所述样本数据的属性信息。5.根据权利要求1-3任意一项所述的数据处理方法,其特征在于,所述根据所述属性信息进行等级划分处理得到多个数据等级的步骤,包括:获取数据等级的预设数量;根据所述属性信息和所述预设数量进行划分处理得到预设数量个数据等级。6.一种数据处理装置,其特征在于,包括:属性信息获取...
【专利技术属性】
技术研发人员:陈英豪,刘震,杨鑫,焦若彤,唐洪斌,
申请(专利权)人:北京树根互联科技有限公司,树根互联技术有限公司,广州树根互联技术有限公司,江苏树根互联技术有限公司,上海树根互联技术有限公司,长沙树根互联技术有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。