一种大数据可视化分析方法技术

技术编号：14182740 阅读：491 留言：0更新日期：2016-12-14 12:08

本发明专利技术涉及一种大数据可视化分析方法，包括：整合大规模数据源，存储后，从中抽取用于分析的样例数据，进行去燥操作，得到分析样本，进行排序、分组统计，找出数据的内在规律，生成数据模型，以DF表的形式保存。最后，以可视化图形方式将数据模型进行输出。本方法可处理海量数据，以更友好的方式查询大量数据，支持函数，数据处理速度快，可视化呈现方式多样。

A visualization method for large data analysis

The present invention relates to a large data visualization analysis method, including: the integration of large data source, storage, for example data analysis and extract to dryness, operation, analysis samples, sorting, statistical analysis, find out the internal rules of data generation, data model, save in the form of DF. Finally, the output of the data model is visualized. This method can deal with massive data, query a large amount of data in a more friendly way, support the function, the data processing speed is fast, and the visual presentation is various.

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据分析
，尤其涉及一种大数据可视化分析方法。
技术介绍
随着IT系统的蓬勃发展，各行各业积聚了大量的数据，对大量数据进行分析，挖掘有价值的信息来促进生产和销售已越来越重要。而承担具体分析工作的行业专家或最终用户，虽然具备丰富的业务知识和一定的IT技能，使用EXCEL数据透视表进行分析，也能处理大量规范数据。但是，用EXCEL数据透视功能进行数据分析，却存在如下缺点：1、只能处理*.xls、*.xlsx格式的数据，对其它格式的数据无能为力；2、处理的数据量有限(*.xls格式只能处理65536行、256列，*.xlsx格式只能处理1048576行、16384列)；3、当数据量较多时，运行速度十分慢。
技术实现思路
本专利技术为克服上述的不足之处，目的在于提供一种大数据可视化分析方法，本方法可处理海量数据，以更友好的方式查询大量数据，支持函数，数据处理速度快，可视化呈现方式多样。本专利技术是通过以下技术方案达到上述目的：一种大数据可视化分析方法，包括如下步骤：(1)整合大规模数据源，并将大规模数据源存储到分布式数据库；(2)通过配置引擎界面配置参数，从大规模数据源中抽取用于分析的样例数据；(3)对样例数据进行去燥操作，消除无关数据，得到分析样本；(4)对分析样本进行排序、分组统计，找出数据的内在规律，生成数据模型，以DF表的形式保存；(5)将数据模型以可视化图形方式进行输出。作为优选，所述的大规模数据源包括EXCEL、CSV、PKL、ESQL、UDB、JDBC、SQLITE、WEBSERVICE、NOSQL数据源中的任意一种或组合。作为优选...
一种大数据可视化分析方法

【技术保护点】
一种大数据可视化分析方法，其特征在于，包括如下步骤：(1)整合大规模数据源，并将大规模数据源存储到分布式数据库；(2)通过配置引擎界面配置参数，从大规模数据源中抽取用于分析的样例数据；(3)对样例数据进行去燥操作，消除无关数据，得到分析样本；(4)对分析样本进行排序、分组统计，找出数据的内在规律，生成数据模型，以DF表的形式保存；(5)将数据模型以可视化图形方式进行输出。

【技术特征摘要】
1.一种大数据可视化分析方法，其特征在于，包括如下步骤：(1)整合大规模数据源，并将大规模数据源存储到分布式数据库；(2)通过配置引擎界面配置参数，从大规模数据源中抽取用于分析的样例数据；(3)对样例数据进行去燥操作，消除无关数据，得到分析样本；(4)对分析样本进行排序、分组统计，找出数据的内在规律，生成数据模型，以DF表的形式保存；(5)将数据模型以可视化图形方式进行输出。2.根据权利要求1所述的一种大数据可视化分析方法，其特征在于：所述的大规模数据源包括EXCEL、CSV、PKL、ESQL、UDB、JDBC、SQLITE、WEBSERVICE、NOSQL数据源中的任意一种或组合。3.根据权利要求1所述的一种大数据可视化分析方法，其特征在于：所述的去燥操作通过调用UDF公式和lambda公式实现。4.根据权利要求3所述的一种大数据可视化分析方法，其特征在于：所述的去燥操作为增加、选择、更改类型、字符串处理中的任意一种操作或组合操作。5.根据权利要求3所述的一种大数据可视化分析方法，其特征在于：所述的UDF公式为：DF2＝@udf DF1 by udf0.UDF0其中，DF2为运算后的返回...

【专利技术属性】
技术研发人员：郜军伟，
申请(专利权)人：杭州合众数据技术有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人