The invention relates to a large data analysis system that integrates search and calculation, including data acquisition layer, preprocessing layer, analysis engine layer and display layer. The invention obtains the results of data analysis by visual search with expression language, greatly reduces the professional requirement of large data analysis platform, reduces the cost of employing IT technicians and business analysts at the same time, and expressive language commands are independent and replaceable. Compared with the programming method of traditional large data platform, the method has expansibility. Strong, greatly reduces the complexity, while improving the efficiency of large data analysis.
【技术实现步骤摘要】
一种融合搜索与计算的大数据分析系统及其分析方法
本专利技术涉及一种大数据分析方法,具体的说是一种融合搜索与计算的大数据分析系统及其分析方法,属于大数据分析处理
技术介绍
随着互联网的高速发展,企业所收集的数据量也呈指数级增长,包括交易数据、位置数据、用户交互数据、物流数据、供应链数据、企业经营数据、硬件监控数据、应用日志数据等,这些数据在短时间内无法通过常规软件进行获取以及处理,是需要全新的处理模式才能从大量数据中发现更有决策力的海量、高增长率和多样化的信息资产。随着现代测量技术和智能设备的发展,数据的形式由传统单一的结构化数据演变为由结构化数据、半结构化数据和非结构化数据组成的复杂的数据形式。互联网的快速发展给了人们以分享这些数据的平台,由此产生的海量数据被人们发现和利用,就产生了新型的大数据概念。IBM给出了大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。相比传统的关系数据库,大数据具有数据量巨大、结构复杂、类型众多等特点,这对大数据的存储、处理与分析提出了新的挑战。传统的数据分析处理技术(例如并行数据库、数据仓库)存在的问题有:①传统的数据仓库技术一般只能处理TB级别的数据量,然而大数据往往PB级别甚至EB级别,并行数据库大多支持有限扩展,一般可扩至数百节点的规模,尚未有数千节点规模的应用案例,传统数据分析处理技术无法处理大数据的高扩展性和海量需求;②大数据涵盖了各种类型的数据,包括结构化、半结构化和非结构化数据,不同类型数据的分析 ...
【技术保护点】
1.一种融合搜索与计算的大数据分析系统,包含数据采集层、预处理层、分析引擎层和显示层;其特征在于:所述数据采集层,用于获取待分析数据;其中待分析数据的来源包含各类文件、网络数据流、各类服务器以及各类业务系统;所述预处理层包含全文检索模块、结构化数据处理模块、分布式数据接口模块,用于对获取的待分析数据进行预处理;所述分析引擎层,一方面针对预处理之后的数据,根据属性类型,进行分类存储;另一方面采集来自显示层的表达式,进行语法分析并进行执行,将分析执行的计算结果返回给显示层;所述显示层,用于显示融合搜索与计算的大数据的分析结果,所述显示层采用面板、图表、表达式的方式显示融合搜索与计算的大数据的分析结果。
【技术特征摘要】
2017.09.11 CN 20171081219491.一种融合搜索与计算的大数据分析系统,包含数据采集层、预处理层、分析引擎层和显示层;其特征在于:所述数据采集层,用于获取待分析数据;其中待分析数据的来源包含各类文件、网络数据流、各类服务器以及各类业务系统;所述预处理层包含全文检索模块、结构化数据处理模块、分布式数据接口模块,用于对获取的待分析数据进行预处理;所述分析引擎层,一方面针对预处理之后的数据,根据属性类型,进行分类存储;另一方面采集来自显示层的表达式,进行语法分析并进行执行,将分析执行的计算结果返回给显示层;所述显示层,用于显示融合搜索与计算的大数据的分析结果,所述显示层采用面板、图表、表达式的方式显示融合搜索与计算的大数据的分析结果。2.根据权利要求1所述的融合搜索与计算的大数据分析系统,其特征在于:所述全文检索模块,用于对获取的待分析数据进行检索;结构化数据处理模块,用于对获取的待分析数据结构化处理;分布式数据接口模块,用于对获取的待分析数据进行数据传输及存储。3.根据权利要求1所述的融合搜索与计算的大数据分析系统,其特征在于:所述数据采集层和预处理层之间还设有安全隔离层。4.根据权利要求1所述的融合搜索与计算的大数据分析系统,其特征在于:所述分析引擎层将来自显示层的表达式进行语法分析,分解成一级一级的子命令,再顺序执行各个子命令;每个子...
【专利技术属性】
技术研发人员:童欢欢,
申请(专利权)人:南京弹跳力信息技术有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。