【技术实现步骤摘要】
一种计算机大数据存储系统
[0001]本专利技术涉及大数据存储
,具体为一种计算机大数据存储系统
。
技术介绍
[0002]随着数字化时代的到来,大量的数据被生成
、
收集和存储,从生活中的数据
、
社交媒体数据到企业交易数据,以及科学研究中的实验数据,数据规模呈现爆发式增长的趋势
。
大数据存储系统需要能够处理不同种类和格式的数据,包括结构化数据
(
如关系数据库
)、
半结构化数据
(
如
XML
和
JSON)
以及非结构化数据
(
如图像
、
音频和视频数据
)。
传统关系型数据库在处理非结构化和半结构化数据方面存在局限性,因此需要新的存储系统来应对这些挑战,并且传统的存储系统无法满足这种海量数据的存储和处理需求,因此需要开发更为高效和可扩展的大数据存储系统,所以,在此提出了一种计算机大数据存储系统
。
[0003]目前,计算机大数据存储系统在进行海量数据存储的时候,为了方便数据的存储和调用,都会将存储的数据进行分类并且存储在不同的数据存储区中,在调用的时候访问对应的存储区,但是对于海量的数据来说,每一个存储区中的数据量依然非常巨大,需要占用大量的存储空间,影响存储效果,对此,我们提出了一种计算机大数据存储系统能够有效的利用当前有限的存储空间,将存储的数据有规律的进行压缩,在调用的时候,有条理的进行数据的访 ...
【技术保护点】
【技术特征摘要】
1.
一种计算机大数据存储系统,包括用于了解对数据存储的需求和期望,了解系统所需的存储容量
、
数据分类方式的需求分析模块
(1)
;用于采集存储系统需要进行分类存储的数据的数据采集模块
(2)
;用于在存储数据之前对数据进行清洗以及填补缺失值等操作的数据预处理模块
(3)
;用于将需要存储的数据进行分区和分桶更便于数据有序存储的数据分区模块
(4)
;用于存储海量数据的大数据存储模块
(5)
;用于对数据进行保护防止出现意外导致数据损失的数据备份与恢复模块
(6)
;其特征在于:首先通过需求分析模块
(1)
对需要存储以及获取的数据进行了解和期望,然后通过数据采集模块
(2)
对相关需要存储的数据进行采集处理,然后数据预处理模块
(3)
对采集的数据进行相关预处理便于后续的分类以及压缩,然后通过数据分区模块
(4)
将数据划分成具有逻辑的数据块最后将数据存储至大数据存储模块
(5)
中
。2.
根据权利要求1所述的一种计算机大数据存储系统,其特征在于:所述需求分析模块
(1)
首先会对需要存储的相关数据信息进行需求分收集,例如对需要存储的数据的期望以及需求,然后需求分析模块
(1)
会对其进行需求整理,将需要存储的数据需求分析完成后将数据需求进行分级排序,根据存储需求的优先级向数据采集模块
(2)
传输采集指令
。3.
根据权利要求1所述的一种计算机大数据存储系统,其特征在于:所述数据采集模块
(2)
接收到需求分析模块
(1)
传输的采集指令后,数据采集模块
(2)
根据需求分析
(1)
分析的存储数据优先级对数据进行采集,数据采集模块
(2)
通常采用
API
调用技术,如果采集的目标数据源提供了
API
接口,就能够通过数据采集模块
(2)API
调用来采集数据,在数据采集模块
(2)
获取完数据后会将其传输至数据预处理模块
(3)。4.
根据权利要求1所述的一种计算机大数据存储系统,其特征在于:所述数据预处理模块
(3)
对数据采集模块
(2)
采集的相关数据进行预处理操作,具体包括对数据的清洗以及数据转换,同时填补数据的缺失值,保证数据的一致性和有效性,同时数据预处理模块
(3)
还会对数据状态进行异常检测与处理,通过采用数据挖掘算法等方法,对数据进行挖掘的同时发现其中的异常数据,例如存在离群点
...
【专利技术属性】
技术研发人员:赵萌,栾国明,关宇光,王雄飞,周健,
申请(专利权)人:北京三博脑科医院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。