一种基于流式处理框架的大规模数据处理装置及方法制造方法及图纸

技术编号：16346214 阅读：50 留言：0更新日期：2017-10-03 22:25

本发明专利技术公开了一种基于流程处理框架的大规模数据处理装置及方法，该装置包括：拓扑构建模块，用于根据XML配置文件构建数据处理拓扑；数据读取模块，用于从数据源读取带有标记的原始数据，并根据标记加载逻辑配置文件，得到附加逻辑配置的数据；数据处理模块，用于接收附加逻辑配置的数据，动态调用处理方法，生成处理结果并进行分流；聚合模块，用于接收分流的处理结果并进行聚合；存储模块，用于接收聚合结果，并将其存储到指定存储介质中。本发明专利技术基于流式处理框架，数据处理速度快，能够及时处理新增数据；新增的处理规则在Redis中配置即可动态调用，数据的插入方式多样；在不同场景下只需简单的配置修改即可使用，具有一定的应用前景。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于流式处理框架的大规模数据处理装置及方法
本专利技术涉及计算机
，特别涉及一种基于流式处理框架的大规模数据处理装置及方法。
技术介绍
目前，大规模数据一般采用多线程单实例的处理方式，此方式通常运行在一台服务器上，对业务的针对性高，但相应的配置较少。随着数据爆发式的增长，传统的数据处理方式已经不能够满足大规模数据处理对于速度、性能的要求，主要缺陷如下：1、由于单台服务器存在如网络稳定性差、CPU用量过高等性能瓶颈，因此，数据处理速度不够快，并且不能及时处理新增数据。2、进行数据处理时，没有配置文件来干预处理过程，处理规则不能动态配置，一旦处理规则发生变化，需要重新启动程序。3、一次运行中插入的语句(如SQL)是固定的，不能动态修改，数据插入方式单一，不支持多种插入方式。4、一次数据处理只能使用于一个业务场景，与具体业务的耦合性很高，独立性差，不方便迁移。因此，亟需一种基于流式处理框架的大规模数据处理装置及方法。
技术实现思路
专利技术的目的：为了解决
技术介绍
中存在的技术问题，提供一种基于流式处理框架的大规模数据处理装置及方法。为达到上述目的，本专利技术采用的技术方案是：提供了一种基于流式处理框架的大规模数据处理装置，包括：拓扑构建模块，用于根据XML配置文件构建数据处理拓扑，同时建立数据处理拓扑与数据源、存储介质的连接；数据读取模块，用于从数据源读取带有标记的原始数据，并根据标记加载对应的逻辑配置文件，得到附加逻辑配置的数据；所述逻辑配置文件包含处理逻辑、处理方法和存储逻辑内容；数据处理模块，用于接收附加逻辑配置的数据，并根据逻辑配置中的处理逻辑动态...
一种基于流式处理框架的大规模数据处理装置及方法

【技术保护点】
一种基于流式处理框架的大规模数据处理装置，其特征在于，包括：拓扑构建模块，用于根据XML配置文件构建数据处理拓扑，同时建立数据处理拓扑与数据源、存储介质的连接；数据读取模块，用于从数据源读取带有标记的原始数据，并根据标记加载对应的逻辑配置文件，得到附加逻辑配置的数据；所述逻辑配置文件包含处理逻辑、处理方法和存储逻辑内容；数据处理模块，用于接收附加逻辑配置的数据，并根据逻辑配置中的处理逻辑动态调用对应的处理方法，生成处理结果并根据存储逻辑进行分流；聚合模块，用于接收分流的处理结果并对其进行聚合，得到聚合结果；存储模块，用于接收聚合结果，并根据存储逻辑将聚合结果存储到指定的存储介质中。

【技术特征摘要】
1.一种基于流式处理框架的大规模数据处理装置，其特征在于，包括：拓扑构建模块，用于根据XML配置文件构建数据处理拓扑，同时建立数据处理拓扑与数据源、存储介质的连接；数据读取模块，用于从数据源读取带有标记的原始数据，并根据标记加载对应的逻辑配置文件，得到附加逻辑配置的数据；所述逻辑配置文件包含处理逻辑、处理方法和存储逻辑内容；数据处理模块，用于接收附加逻辑配置的数据，并根据逻辑配置中的处理逻辑动态调用对应的处理方法，生成处理结果并根据存储逻辑进行分流；聚合模块，用于接收分流的处理结果并对其进行聚合，得到聚合结果；存储模块，用于接收聚合结果，并根据存储逻辑将聚合结果存储到指定的存储介质中。2.根据权利要求1所述的基于流式处理框架的大规模数据处理装置，其特征在于，所述数据源为消息中间件或持久化存储介质。3.根据权利要求2所述的基于流式处理框架的大规模数据处理装置，其特征在于，所述消息中间件包括：用于缓存原始数据的Kafka和用于缓存逻辑配置文件的Redis，所述持久化存储介质包括：关系数据库Mysql和索引Solr。4.根据权利要求1所述的基于流式处理框架的大规模数据处理装置，其特征在于，所述存储介质还包括：Mongodb。5.根据权利要求1所述的基于流式处理框架的大规模数据处理装置，其特征在于，所述存储逻辑包括：数据库实例、表名、插入方式和插入字段。6.一种基于流式处理框架的大...

【专利技术属性】
技术研发人员：曾琰，陈敏，张圣栋，
申请(专利权)人：湖南星汉数智科技有限公司，
类型：发明
国别省市：湖南,43

全部详细技术资料下载我是这个专利的主人