一种数据处理和存储方法技术

技术编号：34789616 阅读：13 留言：0更新日期：2022-09-03 19:52

本发明专利技术公开一种数据处理和存储方法，涉及数据处理技术领域，解决的技术问题是数据处理和存储，本发明专利技术采用以下技术方案，一种数据处理和存储方法，包括以下方法：步骤一、在控制器作用下从数据库中获取数据信息，对获取到的数据信息进行预处理；步骤二、将预处理后的数据信息存储起来，通过HBASE+HIVE+SPARK存储模块实现数据信息存储；步骤三、在数据存储过程中通过软聚类算法模型实现数据信息分类，提高数据信息处理能力；步骤四、对处理后的数据信息通过调度算法实现数据信息调度。本发明专利技术能够提高数据信息处理和存储能力，提高用户利用数据信息的能力。信息的能力。信息的能力。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据处理和存储方法

[0001]本专利技术涉及数据处理
，且更确切地涉及一种数据处理和存储方法。

技术介绍

[0002]随着信息技术的飞速发展，互联网技术、多媒体技术、物联网技术以及云计算技术也迅速蓬勃发展，大量的数据信息被传递、存储和应用，由于物质载体和使用范围的不同，非均质性的海量复杂异构数据逐步渗透到各种应用中，这就给数据的处理和应用带来麻烦。非均质性的海量复杂异构数据繁多，如何对诸如图片、试听材料、音频材料等多种结构化、非结构化和半结构化的数据进行存储、应用就成为亟待解决的问题。随着数据信息量的增加，如何实现数据信息计算、存储和应用是当前处理数据问题中的关键。

技术实现思路

[0003]针对上述技术的不足，本专利技术公开一种数据处理和存储方法，能够提高数据信息处理和存储能力，提高用户利用数据信息的能力。
[0004]为了实现上述技术效果，本专利技术采用以下技术方案：一种数据处理和存储方法，其中包括以下方法：步骤一、在控制器作用下从数据库中获取数据信息，对获取到的数据信息进行预处理，并控制数据库数据信息的持续性读入和读出，不断对数据库中的数据信息进行更新；步骤二、将预处理后的数据信息存储起来，通过HBASE+HIVE+SPARK存储模块实现数据信息存储，其中HBASE+HIVE+SPARK存储模块内设置流量计算模块和并行计算模块；步骤三、在数据存储过程中通过软聚类算法模型实现数据信息分类，提高数据信息处理能力；步骤四、对处理后的数据信息通过调度算法实现数据信息调度，未调度的数...

【技术保护点】

【技术特征摘要】
1.一种数据处理和存储方法，其特征在于：包括以下方法：步骤一、在控制器作用下从数据库中获取数据信息，对获取到的数据信息进行预处理，并控制数据库数据信息的持续性读入和读出，不断对数据库中的数据信息进行更新；步骤二、将预处理后的数据信息存储起来，通过HBASE+HIVE+SPARK存储模块实现数据信息存储，其中HBASE+HIVE+SPARK存储模块内设置流量计算模块和并行计算模块；步骤三、在数据存储过程中通过软聚类算法模型实现数据信息分类，提高数据信息处理能力；步骤四、对处理后的数据信息通过调度算法实现数据信息调度，未调度的数据信息被存储起来，处理后的数据信息被传递。2.根据权利要求1所述的一种数据处理和存储方法，其特征在于：控制器为ARM32位的CortexTM
‑
M3 CPU处理器。3.根据权利要求1所述的一种数据处理和存储方法，其特征在于：不断对数据库中的数据信息进行更新的方法为：设置数据输入间隔时间，通过数据协议识别数据传输过程中的数据信息，并通过数据过滤模块对数据库中的数据信息过滤。4.根据权利要求1所述的一种数据处理和存储方法，其特征在于：HBASE+HIVE+SPARK存储模块包括HBASE模块、 HIVE模块和SPARK模块。5.根据权利要求4所述的一种数据处理和存储方法，其特征在于：HBASE+HIVE+SPARK存储模块实现数据存储的方法为：（1）数据信息写入：首先通过文件信息进行数据信息写入，在不同数据库的客户端中，通过调用函数实现数据信息的调用，将接收到的数据信息不同文件信息输出到HBASE、HIVE或者SPARK数据库中， FSData Output Stream 将接收到的文件信息分成若干个小包，在不同数据库的数据节点之间实现数据信息的交互；（2）数据信息的读取，通过调用open函数，向与该数据函数互通的架构节点发出数据读取请求，通过各个数据库内设置的元数据节点，能够获取文件内部蕴含的数据块信息；（3）数据存储，在进行数据存储时，调取区块的数据程序，当前的区块数据流断开后，通过选择数据节点获取数据块，然后调取close函数阻断当前的数据流完成数据的存储。6.根据权利要求1所述的一种数据处理和存储方法，其特征在于：流量计算模块为多数据流协同计算模块，实现方法为：步骤一、建立数据流协同计算模型，分别在HBASE模块、 HIVE模块和SPARK模块中计算多数据流量数据信息，如公式（1）所示：（1）在公式（1）中，表示多数据流量数据信息输出模型，表示数据更新函数，
表示计算次数，表示计算总数，表示数据更新函数有效角度，表示在时间下的数据通信协议更新参数；表示多数据流量数据信息库；表示多数据流量数据信息库中的信息种类；步骤二、构建全局函数；（2）在公式（2）中，表示全局函数输出值，表示全局函数工作过程中的稳定性系数，和为不同数据库信息下的数据参数；步骤三、构建本地函数数据信息，如公式（3）所示：（3）在公式（3）中，表示滑动窗口中数据的内积，表示数据流的条数。7.根据权利要求1所述的一种数据处理和存储方法，其特征在于：并行计算模块包括数据特征提取模块、HBASE模块接口、HBASE模块接口、SPARK模块接口、时序匹配模块、缓...

【专利技术属性】
技术研发人员：叶子维，
申请(专利权)人：深圳市共赢晶显技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人