一种数据处理系统和方法技术方案

技术编号:17970629 阅读:4 留言:0更新日期:2018-05-16 11:26
本发明专利技术公开了一种数据处理系统和方法,涉及大数据分析处理领域。该处理方法包括:可视化页面系统实时下发规则数据到数据库服务器中;预处理服务器从所述数据库服务器获取所述规则数据、业务基础数据和待处理的业务数据,根据所述规则数据和所述业务基础数据对所述业务数据进行流式预处理;数据库服务器获取并存储预处理后的业务数据。通过本发明专利技术,用户可利用可视化页面系统修改预处理规则,规则数据实时下发到数据库服务器,预处理服务器能够及时获取到新的规则数据并解析应用,无需重启系统,有效的预防系统重启导致的数据丢失和堆积。

【技术实现步骤摘要】
一种数据处理系统和方法
本专利技术涉及大数据处理
,尤其涉及一种数据处理系统和方法。
技术介绍
数据预处理技术主要实现对数据的去噪、重构、比对、富化等操作,涉及“数据预处理体系结构”、“基于元数据的异构数据处理”两个方面,为后续数据对象化存储和对数据的分析计算提供高质量的数据支持。预处理业务主要根据预处理规则来执行,现有技术中,当预处理规则发生改变时,不能实时应用到当前的预处理中。增加或删减预处理规则后,系统需要重新编码和重新启动才能应用新的规则;系统重启会带来数据丢失或积压的问题,导致结果数据偏差或者不能实时反馈。
技术实现思路
本专利技术的目的在于提出一种数据处理系统和方法,能够实时更改并应用新的数据预处理规则,并实现可视化操作。为达此目的,本专利技术采用以下技术方案:一方面,本专利技术提供一种数据处理系统,包括:预处理服务器集群、数据库服务器集群、Web应用服务器集群和客户端;预处理服务器集群、数据库服务器集群和Web应用服务器集群通过交换机组成分布式存储系统;客户端通过Web应用服务器提供的应用接口访问所述Web应用服务器上的可视化页面系统。其中,Web应用服务器集群与交换机之间架设有防火墙。另一方面,本专利技术提供一种数据处理方法,包括:可视化页面系统实时下发规则数据到数据库服务器中;预处理服务器从所述数据库服务器获取所述规则数据、业务基础数据和待处理的业务数据,根据所述规则数据和所述业务基础数据对所述业务数据进行流式预处理;数据库服务器获取并存储预处理后的业务数据。其中,所述规则数据存储在数据库服务器的内存数据库中;所述业务基础数据和所述业务数据存储在数据库服务器的数据库或者文件系统中。进一步的,根据所述规则数据和所述业务基础数据对所述业务数据进行流式预处理,包括:预处理服务器读取所述规则数据中的规则,根据所述规则将所述业务基础数据与所述业务数据比对,以进行预处理。进一步的,预处理服务器从所述数据库服务器获取所述规则数据,包括:预处理服务器按照周期从所述数据库服务器获取所述规则数据;或者预处理服务器收到所述数据库服务器更新所述规则数据的消息后,从所述数据库服务器获取所述规则数据。进一步的,预处理服务器从所述数据库服务器获取所述规则数据、业务基础数据和待处理的业务数据,包括:预处理服务器接收所述数据库服务器推送的数据,根据所述数据的标志对所述数据进行分类,区分出规则数据、业务基础数据和业务数据。进一步的,数据库服务器获取并存储预处理后的业务数据之后,还包括:所述可视化页面系统获取并以图表形式显示所述业务数据,提供图表结构维护、规则数据配置、业务数据查询的应用接口。本专利技术的有益效果为:用户可通过可视化页面系统修改预处理规则,规则数据实时下发到数据库服务器,预处理服务器能够及时获取到新的规则数据并解析应用,无需重启系统,有效的预防系统重启导致的数据丢失和堆积。附图说明图1是本专利技术实施例提供的数据处理系统的结构示意图;图2是本专利技术实施例提供的数据处理方法的流程图。具体实施方式为使本专利技术解决的技术问题、采用的技术方案和达到的技术效果更加清楚,下面将结合附图对本专利技术实施例的技术方案作进一步的详细描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。本实施例提供一种数据处理系统,用于提供大数据的分析处理平台,提供数据服务。图1是本专利技术实施例提供的数据处理系统的结构示意图。如图1所示,该系统包括:预处理服务器1集群、数据库服务器2集群、Web应用服务器3集群和客户端5;预处理服务器1集群、数据库服务器2集群和Web应用服务器3集群通过交换机4组成分布式存储系统;客户端5通过Web应用服务器3提供的应用接口访问所述Web应用服务器3上的可视化页面系统。其中,Web应用服务器3集群与交换机4之间架设有防火墙5。预处理服务器1集群、数据库服务器2集群和连接他们的交换机4组成局域网;客户端5与Web应用服务器3之间通过交换机连接,必要的情况下可加入多层路由以实现网络拓扑结构。分布式大数据存储和检索技术能够存储和分析的数据量大,数据类型多样,既有结构化数据,也有如视音频、网页、文档等半结构化和非结构化信息,根据数据类型、容量、使用模式的不同,采用关系型数据库、NoSQL数据库、内存数据库、分布式文件系统等不同的技术来对数据信息进行存储。针对异构数据类型,建立符合不同业务逻辑的专用数据库机制。本实施例还提供一种数据处理方法,由上述数据处理系统来执行,用于解决相同的技术问题,达到相同的技术效果。图2是本专利技术实施例提供的数据处理方法的流程图。如图2所示,该方法包括如下步骤:S11,可视化页面系统实时下发规则数据到数据库服务器中。所述可视化页面系统以图表等形式向用户展示业务数据,并提供图表结构维护、规则数据配置、业务数据查询的应用接口。S12,预处理服务器从所述数据库服务器获取所述规则数据、业务基础数据和待处理的业务数据,根据所述规则数据和所述业务基础数据对所述业务数据进行流式预处理。其中,所述规则数据存储在数据库服务器的内存数据库中,本实施例采用Redis内存数据库;所述业务基础数据和所述业务数据存储在数据库服务器的数据库或者文件系统中。预处理服务器接收所述数据库服务器推送的数据,根据所述数据的标志对所述数据进行分类,区分出规则数据、业务基础数据和业务数据。并且预处理服务器按照周期从所述数据库服务器获取所述规则数据;或者预处理服务器收到所述数据库服务器更新所述规则数据的消息后,从所述数据库服务器获取所述规则数据。预处理服务器读取所述规则数据中的规则,根据所述规则将所述业务基础数据与所述业务数据比对,以实现比对、富化、打标、去重等预处理。例如,根据规则数据中的规则,将业务数据中的字段A与业务基础数据中的字段B进行对比或匹配,根据结果,从业务数据中删除字段C,或者将业务基础数据中的字段D加入业务数据中。本实施例中,预处理服务器采用可实现流式预处理的Hadoop分布式服务器集群或者spark分布式服务器集群。S13,数据库服务器获取并存储预处理后的业务数据。本实施例搭建ElasticSearch数据库集群、HBASE集群或者HDFS文件系统服务器,专门用于存储预处理后的结构化数据。使用ElasticSearch数据库作为存储介质,可为数据索引存储、全文检索、字段检索做技术储备;使用HBASE数据库作为存储介质,可为海量PB级数据的存储做技术储备,也有助于提高大数据的加载速度。步骤S13之后,还包括:S14,所述可视化页面系统获取并以图表形式显示所述业务数据。数据可视化技术包含在页面上可视化的数据导入、数据查询、语句检索、可视化图形等,支持以图形化的形式展现不同维度的统计视图,在功能层面以数据为中心进行组织和展现,主要包括:数据统计、用户使用系统统计等。本实施例中,用户可通过可视化页面系统修改预处理规则,规则数据实时下发到数据库服务器,预处理服务器能够及时获取到新的规则数据并解析应用,无需重启系统,有效的预防系统重启导致的数据丢失和堆积。以上结合具体实施例描述了本专利技术的技术原理。这些描述只是为了解释本专利技术的原理,而不能以任何方式解释为对本专利技术保护范围的限制。基于此处的解释,本领域的技术人员不需要付出创造性的劳动即可本文档来自技高网...
一种数据处理系统和方法

【技术保护点】
一种数据处理系统,其特征在于,包括:预处理服务器集群、数据库服务器集群、Web应用服务器集群和客户端;预处理服务器集群、数据库服务器集群和Web应用服务器集群通过交换机组成分布式存储系统;客户端通过Web应用服务器提供的应用接口访问所述Web应用服务器上的可视化页面系统。

【技术特征摘要】
1.一种数据处理系统,其特征在于,包括:预处理服务器集群、数据库服务器集群、Web应用服务器集群和客户端;预处理服务器集群、数据库服务器集群和Web应用服务器集群通过交换机组成分布式存储系统;客户端通过Web应用服务器提供的应用接口访问所述Web应用服务器上的可视化页面系统。2.根据权利要求1所述的数据处理系统,其特征在于:Web应用服务器集群与交换机之间架设有防火墙。3.一种数据处理方法,其特征在于,包括:可视化页面系统实时下发规则数据到数据库服务器中;预处理服务器从所述数据库服务器获取所述规则数据、业务基础数据和待处理的业务数据,根据所述规则数据和所述业务基础数据对所述业务数据进行流式预处理;数据库服务器获取并存储预处理后的业务数据。4.根据权利要求3所述的数据处理方法,其特征在于:所述规则数据存储在数据库服务器的内存数据库中;所述业务基础数据和所述业务数据存储在数据库服务器的数据库或者文件系统中。5.根据权利要求3所述的数据处理方法,其特征在于,根据所述规则数据和...

【专利技术属性】
技术研发人员:谢永恒韩石磊火一莽万月亮
申请(专利权)人:北京锐安科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1