一种基于流处理的内涝数据处理系统及其处理方法技术方案

技术编号:14820003 阅读:128 留言:0更新日期:2017-03-15 12:56
本发明专利技术公开了一种基于流处理的内涝数据处理系统,其包括内涝模型计算模块、Flume模块、Kafka模块、SparkStreaming模块和应用系统。采用SparkStreaming流处理框架来提高读取和处理效率,以时间戳间隔将计算结果提交给流处理框架,在流处理框架中进行Shp文件的解析,并对同一个结点的结果,跟上一个时间的结果进行比较,输出每个结点相对上一次结果,水深值不一样的三角网格进行输出。进而满足实际的需求。提高我们的处理和展示的效率。

【技术实现步骤摘要】

本专利技术属于大数据流处理的应用领域,具体而言涉及一种处理内涝数据的系统和方法。
技术介绍
随着大数据的发展,人们对大数据的处理要求也越来越高,原有的批处理框架MapReduce适合离线计算,却无法满足实时性要求较高的业务,如实时推荐、用户行为分析等。SparkStreaming是建立在Spark上的实时计算框架,通过它提供的丰富的API、基于内存的高速执行引擎,用户可以结合流式、批处理和交互试查询应用,Spark是一个类似于MapReduce的分布式计算框架,其核心是弹性分布式数据集,提供了比MapReduce更丰富的模型,可以在快速在内存中对数据集进行多次迭代,以支持复杂的数据挖掘算法和图形计算算法。SparkStreaming是一种构建在Spark上的实时计算框架,它扩展了Spark处理大规模流式数据的能力。Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统,支持在系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。Flume主要由3个重要的组件购成:Source:完成对日志数据的收集,分成transtion和event打入到channel之中。Channel:主要提供一个队列的功能,对source提供中的数据进行简单的缓存。Sink:取出Channel中的数据,进行相应的存储文件系统,数据库,或者提交到远程服务器。对现有程序改动最小的使用方式是使用是直接读取程序原来记录的日志文件,基本可以实现无缝接入,不需要对现有程序进行任何改动。Flume逻辑上分三层架构:agent,collector和storage。①agent用于采集数据,agent是flume中产生数据流的地方,同时,agent会将产生的数据流传输到collector。②collectorcollector的作用是将多个agent的数据汇总后,加载到storage中。③storagestorage是存储系统,可以是一个普通file,也可以是HDFS,HIVE,HBase等。目前,由于由于地理信息的特性,内涝模型的实时预测未能采用分布式计算来提高自身的计算效率。因此对于大面积内涝模型的计算,采用多个结点进行不同区域的计算然后将各个结点的处理结果进行处理。但是对于模型预测面积越来越大的时候,需要处理的数据也越来越多,单个工作站或者配置更高的服务器越来越难满足这种变化的需求。
技术实现思路
为克服现有技术中的不足,本专利技术的目的在于提供一种基于流处理的内涝数据处理系统以提高结果的展示效果的效率及实时性。为实现上述技术目的,达到上述技术效果,本专利技术通过以下技术方案实现:一种基于流处理的内涝数据处理系统,其包括内涝模型计算模块、Flume模块、Kafka模块、SparkStreaming模块和应用系统;所述内涝模型计算模块将产生大量的内涝预测技术结果数据,然后以Shp格式存储为Shp文件(Shp文件由ESRI开发,一个ESRI的Shp文件包括一个主文件,一个索引文件,和一个dBASE表,其中主文件的后缀就是.shp),所述Flume模块通过其Agent收集所述Shp文件,然后汇总到所述Flume模块的collector,所述Flume模块的Sink将日志输送到所述Kafka模块完成数据的生产流程,所述SparkStreaming模块追踪消费这个数据的偏移量或者offset进行消费,所述SparkStreaming模块中编写有解析所述Shp文件的程序,所述程序解析所述Shp文件后返回每次变化的结果,再传输给所述Kafka模块,再由所述应用系统和所述Kafka系统建立通信,监听特定的消息队列,获取变化的结果,完成GIS信息的展示。本专利技术的另一个专利技术目的为提供一种基于流处理的内涝数据处理方法,其包括以下步骤:1)通过内涝模型计算模块对结点进行不同区域的计算;2)通过Flume模块将这些多个结点的预测计算结果进行收集处理;3)通过SparkStreaming模块对收集的结果进行处理,以时间戳间隔将计算结果提交给流处理框架,在流处理框架中进行Shp文件的解析;4)通过Kafka模块对同一个结点的结果,跟上一个时间的结果进行比较;5)通过应用系统输出每个结点相对上一次结果,水深值不一样的三角网格进行输出。本专利技术的有益效果是:与现有技术相比,本专利技术的系统及其方法将内涝模型的计算结果用于流计算框架,提高内涝预警的展示的速度。能使管理者更快的采取防范措施,减少损失。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,并可依照说明书的内容予以实施,以下以本专利技术的较佳实施例并配合附图详细说明如后。本专利技术的具体实施方式由以下实施例及其附图详细给出。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1为本专利技术的系统框架示意图。具体实施方式下面将参考附图并结合实施例,来详细说明本专利技术。参见图1所示,一种基于流处理的内涝数据处理系统,其包括内涝模型计算模块1、Flume模块2、Kafka模块3、SparkStreaming模块4和应用系统5;所述内涝模型计算模块1将产生大量的内涝预测技术结果数据,然后以Shp格式存储为Shp文件,所述Flume模块2通过其Agent收集所述Shp文件,然后汇总到所述Flume模块2的collector,所述Flume模块2的Sink将日志输送到所述Kafka模块3完成数据的生产流程,所述SparkStreaming模块4追踪消费这个数据的偏移量或者offset进行消费,所述SparkStreaming模块4中编写有解析所述Shp文件的程序,所述程序解析所述Shp文件后返回每次变化的结果,再传输给所述Kafka模块3,再由所述应用系统5和所述Kafka系统3建立通信,监听特定的消息队列,获取变化的结果,完成GIS信息的展示。本实施例的内涝数据处理系统的处理方法如下:1)通过内涝模型计算模块1对结点进行不同区域的计算;2)通过Flume模块2将这些多个结点的预测计算结果进行收集处理;3)通过SparkStreaming模块4对收集的结果进行处理,以时间戳间隔将计算结果提交给流处理框架,在流处理框架中进行Shp文件的解析;4)通过Kafka模块3对同一个结点的结果,跟上一个时间的结果进行比较;5)通过应用系统5输出每个结点相对上一次结果,水深值不一样的三角网格进行输出。以上所述仅为本专利技术的优选实施例而已,并不用于限制本专利技术,对于本领域的技术人员来说,本专利技术可以有各种更改和变化。凡在本专利技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本专利技术的保护范围之内。本文档来自技高网
...
一种<a href="http://www.xjishu.com/zhuanli/55/201611026709.html" title="一种基于流处理的内涝数据处理系统及其处理方法原文来自X技术">基于流处理的内涝数据处理系统及其处理方法</a>

【技术保护点】
一种基于流处理的内涝数据处理系统,其特征在于:包括内涝模型计算模块(1)、Flume模块(2)、Kafka模块(3)、SparkStreaming模块(4)和应用系统(5);所述内涝模型计算模块(1)将产生大量的内涝预测技术结果数据,然后以Shp格式存储为Shp文件,所述Flume模块(2)通过其Agent收集所述Shp文件,然后汇总到所述Flume模块(2)的collector,所述Flume模块(2)的Sink将日志输送到所述Kafka模块(3)完成数据的生产流程,所述SparkStreaming模块(4)追踪消费这个数据的偏移量或者offset进行消费,所述SparkStreaming模块(4)中编写有解析所述Shp文件的程序,所述程序解析所述Shp文件后返回每次变化的结果,再传输给所述Kafka模块(3),再由所述应用系统(5)和所述Kafka系统(3)建立通信,监听特定的消息队列,获取变化的结果,完成GIS信息的展示。

【技术特征摘要】
1.一种基于流处理的内涝数据处理系统,其特征在于:包括内涝模型计算模块(1)、Flume模块(2)、Kafka模块(3)、SparkStreaming模块(4)和应用系统(5);所述内涝模型计算模块(1)将产生大量的内涝预测技术结果数据,然后以Shp格式存储为Shp文件,所述Flume模块(2)通过其Agent收集所述Shp文件,然后汇总到所述Flume模块(2)的collector,所述Flume模块(2)的Sink将日志输送到所述Kafka模块(3)完成数据的生产流程,所述SparkStreaming模块(4)追踪消费这个数据的偏移量或者offset进行消费,所述SparkStreaming模块(4)中编写有解析所述Shp文件的程序,所述程序解析所述Shp文...

【专利技术属性】
技术研发人员:史鑫明
申请(专利权)人:苏州航天系统工程有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1