一种大数据存储管理系统技术方案

技术编号:16587488 阅读:67 留言:0更新日期:2017-11-18 15:05
本发明专利技术适用于数据管理技术领域,提供了一种大数据存储管理系统,包括:云数据服务器以及至少一个智能终端;所述云数据服务器与所述智能终端无线通信连接;其中,所述云数据服务器,包括:数据采集单元、数据分类编号单元、数据并行处理单元、数据恢复单元、数据存储单元以及云数据库;结构合理、运行稳定,提高了数据处理效率和检错率,并降低了对相关数据管理的复杂度,减轻了系统的运算负荷。

A large data storage management system

The invention belongs to the field of data management technology, to provide a large data storage management system, including: cloud data server and at least one intelligent terminal; the cloud data server and the wireless communication intelligent terminal connection; among them, the cloud data server comprises a data acquisition unit, data classification unit and parallel data processing unit, data recovery unit, data storage unit and a cloud database; reasonable structure, stable operation, improve the efficiency of data processing and error detection rate, and reduce the complexity of data management, reduce the computational load of the system.

【技术实现步骤摘要】
一种大数据存储管理系统
本专利技术属于数据管理领域,尤其涉及一种大数据存储管理系统。
技术介绍
随着计算机技术的飞速发展,各行各领域数据的呈几何级快速增长。这些数据来自各方面,从搜集天气情况的感测器、数码图片、在线的视频资料,到网络购物的交易记录、手机的全球定位系统信号等应有尽有。伴随数据规模的急剧膨胀,各行业累积的数据量越来越巨大,数据类型也越来越多、数据结构越来越复杂,已经超越了传统数据管理系统、处理模式的能力范围,传统的串行数据库系统已经难以适应这种飞速增长的应用需求,在生产实践中表现出明显的能力不足,无法满足大数据时代的数据存储需求。在现有技术中,集中式的数据存储方案的数据处理效率低、容灾能力低,系统恢复时间长;分布式的数据存储方案采用DHT方式访问用户数据,以单播方式查找,当发现一个节点失效时,才向另一节点发起查找请求,更新等操作也类似,同样存在数据处理效率低、容灾能力低,并且,实施时需要有繁琐的HASH计算和路由查找过程,实现复杂,同时也有可能出现数据不一致的情况。
技术实现思路
为了克服上述现有技术所存在的问题,本专利技术实施例提供一种大数据存储管理系统,结构合理、运行稳定,提高了数据处理效率和检错率,并降低了对相关数据管理的复杂度,减轻了系统的运算负荷。本专利技术实施例是这样实现的,一种大数据存储管理系统,包括:云数据服务器以及至少一个智能终端;所述云数据服务器与所述智能终端无线通信连接;其中,所述云数据服务器,包括:数据采集单元、数据分类编号单元、数据并行处理单元、数据恢复单元、数据存储单元以及云数据库;所述数据采集单元采集所述智能终端上的数据,并对数据进行初步分类,并将相同类别的数据压缩处理后传输至数据分类编号单元;所述数据分类编号单元将压缩处理后的数据再次分类压缩处理,并将不同类别的相同类型的压缩数据进行数据位置,数据时间,数据容量的类别进行分类,并生成数据分类编号;所述数据并行处理单元采用并行数据预处理技术,设有Map/Reduce处理模型,通过调用Map函数,将每个处理任务由多个Map任务并行处理,这些Map任务被分配到所属处理任务分配的执行节点上执行,再通过调用Reduce函数,分别对每个处理任务的各Map任务的处理结果进行合并操作,完成数据预处理;所述数据存储单元将预处理后的每一个压缩数据按着生成的编号依次存入云数据库;所述数据恢复单元针硬盘驱动器的检错机制,将该机制进行优化从而提高系统的检错效率,从而保证系统实现大数据有效地存储。优选地,所述云数据服务器,还包括:数据冗余判断模块,与数据采集单元、云数据库连接,用于对数据采集单元采集的数据进行冗余判断,若云数据库内存储的数据与数据采集单元采集的数据相同则将相同的数据丢弃。优选地,所述云数据服务器,还包括:数据降噪处理单元,用于对采集到的数据进行降噪预处理;以及数据挖掘单元,用于对云数据库中的数据进行挖掘分析。优选地,所述数据挖掘单元,包括:数据并行挖掘模块,用于从不同角度对云数据库内数据进行多路并行挖掘;挖掘结果融合模块,用于对多路并行的数据并行挖掘模块输出的数据挖掘结果进行汇总;以及融合信息分析模块,用于对汇总后的数据进行分析处理。优选地,所述数据并行处理单元,包括:数据离散化处理模块,用于将压缩处理后的数据进行离散化处理,方便存储和进一步分析。本专利技术实施例提供的大数据存储管理系统,结构合理、运行稳定,提高了数据处理效率和检错率,并降低了对相关数据管理的复杂度,减轻了系统的运算负荷。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。以下附图仅旨在于对本专利技术做示意性说明和解释,并不限定本专利技术的范围。图1是本专利技术实施例提供的一种大数据存储管理系统的结构示意图;图2是本专利技术实施例提供的一种云数据服务器的结构示意图;图3是本专利技术实施例提供的另一种云数据服务器的结构示意图;图4是本专利技术实施例提供的数据挖掘单元的结构示意图;图5是本专利技术实施例提供的数据并行处理单元的结构示意图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。本专利技术实施例提供的大数据存储管理系统,结构合理、运行稳定,提高了数据处理效率和检错率,并降低了对相关数据管理的复杂度,减轻了系统的运算负荷。以下结合具体实施例对本专利技术的具体实现进行详细描述。如图1所示,在本专利技术实施例中,一种大数据存储管理系统,包括:云数据服务器100以及至少一个智能终端200;所述云数据服务器100与所述智能终端200无线通信连接;其中,所述云数据服务器100,包括:数据采集单元110、数据分类编号单元120、数据并行处理单元130、数据恢复单元140、数据存储单元150以及云数据库160;所述数据采集单元110采集所述智能终端上的数据,并对数据进行初步分类,并将相同类别的数据压缩处理后传输至数据分类编号单元;所述数据分类编号单元120将压缩处理后的数据再次分类压缩处理,并将不同类别的相同类型的压缩数据进行数据位置,数据时间,数据容量的类别进行分类,并生成数据分类编号;所述数据并行处理单元130采用并行数据预处理技术,设有Map/Reduce处理模型,通过调用Map函数,将每个处理任务由多个Map任务并行处理,这些Map任务被分配到所属处理任务分配的执行节点上执行,再通过调用Reduce函数,分别对每个处理任务的各Map任务的处理结果进行合并操作,完成数据预处理;所述数据存储单元150将预处理后的每一个压缩数据按着生成的编号依次存入云数据库160;所述数据恢复单元140针硬盘驱动器的检错机制,将该机制进行优化从而提高系统的检错效率,从而保证系统实现大数据有效地存储。结构合理、运行稳定,提高了数据处理效率和检错率,并降低了对相关数据管理的复杂度,减轻了系统的运算负荷。在本专利技术实施例中,如图2所示,所述云数据服务器100,还包括:数据冗余判断模块170,与数据采集单元110、云数据库160连接,用于对数据采集单元110采集的数据进行冗余判断,若云数据库160内存储的数据与数据采集单元110采集的数据相同则将相同的数据丢弃。在本专利技术实施例中,如图3所示,所述云数据服务器100,还包括:数据降噪处理单元180,用于对采集到的数据进行降噪预处理;以及数据挖掘单元190,用于对云数据库中的数据进行挖掘分析。在本专利技术实施例中,如图4所示,所述数据挖掘单元190,包括:数据并行挖掘模块191,用于从不同角度对云数据库内数据进行多路并行挖掘;挖掘结果融合模块192,用于对多路并行的数据并行挖掘模块输出的数据挖掘结果进行汇总;以及融合信息分析模块193,用于对汇总后的数据进行分析处理。在本专利技术实施例中,如图5所示,所述数据并行处理单元130,包括:数据离散化处理模块131,用于将压缩处理后的数据进行离散化处理,方便存储和进一步分析。上述专利技术实施例提供的大数据存储管理系统,结构合本文档来自技高网...
一种大数据存储管理系统

【技术保护点】
一种大数据存储管理系统,其特征在于,包括:云数据服务器以及至少一个智能终端;所述云数据服务器与所述智能终端无线通信连接;其中,所述云数据服务器,包括:数据采集单元、数据分类编号单元、数据并行处理单元、数据恢复单元、数据存储单元以及云数据库;所述数据采集单元采集所述智能终端上的数据,并对数据进行初步分类,并将相同类别的数据压缩处理后传输至数据分类编号单元;所述数据分类编号单元将压缩处理后的数据再次分类压缩处理,并将不同类别的相同类型的压缩数据进行数据位置,数据时间,数据容量的类别进行分类,并生成数据分类编号;所述数据并行处理单元采用并行数据预处理技术,设有Map/Reduce处理模型,通过调用Map函数,将每个处理任务由多个Map任务并行处理,这些Map任务被分配到所属处理任务分配的执行节点上执行,再通过调用Reduce函数,分别对每个处理任务的各Map任务的处理结果进行合并操作,完成数据预处理;所述数据存储单元将预处理后的每一个压缩数据按着生成的编号依次存入云数据库;所述数据恢复单元针硬盘驱动器的检错机制,将该机制进行优化从而提高系统的检错效率,从而保证系统实现大数据有效地存储。

【技术特征摘要】
1.一种大数据存储管理系统,其特征在于,包括:云数据服务器以及至少一个智能终端;所述云数据服务器与所述智能终端无线通信连接;其中,所述云数据服务器,包括:数据采集单元、数据分类编号单元、数据并行处理单元、数据恢复单元、数据存储单元以及云数据库;所述数据采集单元采集所述智能终端上的数据,并对数据进行初步分类,并将相同类别的数据压缩处理后传输至数据分类编号单元;所述数据分类编号单元将压缩处理后的数据再次分类压缩处理,并将不同类别的相同类型的压缩数据进行数据位置,数据时间,数据容量的类别进行分类,并生成数据分类编号;所述数据并行处理单元采用并行数据预处理技术,设有Map/Reduce处理模型,通过调用Map函数,将每个处理任务由多个Map任务并行处理,这些Map任务被分配到所属处理任务分配的执行节点上执行,再通过调用Reduce函数,分别对每个处理任务的各Map任务的处理结果进行合并操作,完成数据预处理;所述数据存储单元将预处理后的每一个压缩数据按着生成的编号依次存入云数据库;所述数据恢复单元针硬盘驱动器的检错机制,将该机...

【专利技术属性】
技术研发人员:陈钦鹏
申请(专利权)人:深圳齐心集团股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1