一种基于分布式计算的可视化流式计算平台制造技术

技术编号：35934737 阅读：13 留言：0更新日期：2022-12-14 10:21

本发明专利技术涉及数据处理技术领域，公开了一种基于分布式计算的可视化流式计算平台，包括抽取模块、转换模块、加载模块和特殊处理模块；所述抽取模块用于采用设定的提取方式从不同的数据源抽取数据，并对抽取的数据进行解析和分发；所述转换模块用于根据所述数据处理规则对抽取的数据进行加工和格式转换；所述加载模块用于将加工和格式转换完成的数据输出到目标数据仓；所述特殊处理模块用于对用户的特殊业务需求进行对应的处理后输出到所述加载模块。本发明专利技术提供的基于分布式计算的可视化流式计算平台，对用户的数据源进行抽取、转换、加载，并依据用户的需求进行特殊处理，将大量的流式数据进行整合，为企业的决策提供分析依据。为企业的决策提供分析依据。为企业的决策提供分析依据。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于分布式计算的可视化流式计算平台

[0001]本专利技术涉及数据处理
，特别涉及一种基于分布式计算的可视化流式计算平台。

技术介绍

[0002]近年来，持续推动大数据技术产业创新，发展以数据为关键要素的数字经济，数字经济政策逐步深化。
[0003]移动通讯行业经历了2G、3G、4G移动网络时代，正在演进的是物联网、5G，每次网络的更新都会引起数据类型、数据量的巨大变化，相应的数据处理技术也在不断演进。物联网、 5G时代，将会有更多的设备连入网络，更多的应用数据需要快速进行分析处理，数据量将会更大，数据价值会更丰富，但对数据处理技术也带来了更多的挑战，主要包括如下几个方面：从数据产生、存储、计算分析出结果，整个流程时延往往在几个小时，但是要求分钟级、甚至秒级的应用需求越来越多；流量飞速增长，存储数据飞速增长，数据中心从TB到PB再到 EB，传统的流处理框架撑不住如此大的流量增长；基于流计算平台的需求需要快速上线，流处理平台需要具备最少的代码开发工作，通过配置的方式适配业务需求的能力。
[0004]为了提高企业的用户体验，就要增加企业服务更多用户的能力。每一个客户都有自己的个性化需求，企业是不能用同一套系统来服务所有的客户。客户量不大的情况还好控制，客户一旦增多，企业就会陷入疲于应付的境地。要么不停地满足老客户的需求，客户需求总是源源不断，企业的成本就会不断地增加，减弱了服务市场的能力。要么就恰恰相反，对于客户的需求一再拖延，甚至拒绝，降低了客户的满意度，丢了客户，只有不断地拓展新市场才能维持...

【技术保护点】

【技术特征摘要】
1.一种基于分布式计算的可视化流式计算平台，其特征在于，包括抽取模块、转换模块、加载模块和特殊处理模块；所述抽取模块用于采用设定的提取方式从不同的数据源抽取数据，并对抽取的数据进行解析和分发；其中，所述数据源包括数据库、kafka、通过ftp上传的文件、已通过流式计算平台处理过一次或多次的数据；所述转换模块用于接收所述抽取模块分发的解析后的数据、用户确定的数据处理规则，并根据所述数据处理规则对抽取的数据进行加工和格式转换；所述加载模块用于将加工和格式转换完成的数据输出到目标数据仓，其中，所述目标数据仓包括数据表或文件；所述特殊处理模块用于对用户的特殊业务需求进行对应的处理后输出到所述加载模块；其中，所述特殊业务需求包括加密、解密和脱敏。2.根据权利要求1所述的基于分布式计算的可视化流式计算平台，其特征在于，所述抽取模块对抽取的数据进行解析和分发，解析规则包括CSV、JSON、XML、压缩数据，所述CSV为用行列分隔符分隔的数据，所述JSON为用js对象表示一条记录，属性名表示字段名，属性值表示字段值，所述XML用xml格式保存的记录集，所述压缩数据为将以上类型数据压缩后的数据,其压缩格式包括：gz,tar.gz,zip。3.根据权利要求2所述的基于分布式计算的可视化流式计算平台，其特征在于，将解析后的数据按元数据定义的表结构表示，所述元数据定义规则和流式计算的表结构，并按照所述规则提取数据并分发数据到所述转换模块；其中，所...

【专利技术属性】
技术研发人员：王敏，程涛木，吴亮，黄国林，何魁，毛尚全，钱玲，
申请(专利权)人：博瑞得科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人