一种面向大数据的多范型融合分析处理方法技术

技术编号：15799173 阅读：255 留言：0更新日期：2017-07-11 13:19

本发明专利技术公开了一种面向大数据的多范型融合分析处理方法，该方法包括以下步骤：数据预处理阶段；配置文件阶段：数据查询分析阶段；用户反馈阶段。本发明专利技术提出的基于GBase数据库的大数据多范型融合分析处理是可以有效满足大数据分析市场需求的解决方案。

Multi paradigm fusion analysis processing method for large data

The invention discloses a multi paradigm for the integration of large data analysis methods, the method comprises the following steps: data preprocessing; configuration file: data query analysis stage; user feedback stage. The method of fusion and analysis of large data and multiple patterns based on GBase database provided by the invention is a solution that can effectively meet the market demand of large data analysis.

全部详细技术资料下载

【技术实现步骤摘要】
一种面向大数据的多范型融合分析处理方法
本专利技术涉及互联网
，具体地说，涉及一种面向大数据的多范型融合分析处理方法。
技术介绍
自上世纪90年代万维网应用普及以来，人类社会每年产生和收集的数据量以惊人的速度增长着。从目前万维网应用的发展趋势看，数据增长速率有增无减，已远超过摩尔定律的增长速率。IDC的调查显示，从2013开始全球产生的数据量以每年40％的速度增长，到2020年全球数据量将增长为现在的10倍，即44。毋容置疑，这标志着人类早经迈入了“大数据时代”。大数据的特点可概括为：大容量(Volume)、高速率(Velocity)、多样化(Variety)和总体价值(Value)，即“4个V”。在大数据时代，数据在量上的增长已经产生了质的飞跃，原来很多困难的事情，借助大数据已变成了现实，大数据分析应运而生。大数据分析(BigDataAnalysis)是通过计算工具处理和分析大数据集，从中发现隐藏的模式、未知的关联、未来的趋势、用户的偏好、有用的商业信息等各种新知识。这项技术对于任何企业和组织的发展都是至关重要的，因为它使得大数据成为了推动企业进行科学决策和战略发展的抓手，将大数据化为了一种与竞争对手比拼的战略资源。可以预见，在未来十年的时间内，谁成功驾驭了大数据分析的利器，谁就赢得了未来企业竞争的商机，谁就能够占领行业制高点。传统关系型数据管理技术虽然经历了并行化的发展，但在一些特殊的应用场景下，依旧不能满足大数据的分析任务，在扩展性和适应性上遇到了巨大障碍。大数据分析方法与技术需要解决的矛盾是：如何在尽量短的时间内，处理和分析尽量多的数据以发现...
一种面向大数据的多范型融合分析处理方法

【技术保护点】
一种面向大数据的多范型融合分析处理方法，其特征在于，包括以下步骤：步骤1、数据预处理阶段：该阶段独立于以下业务流程阶段，是用户将所需要的数据经过用户自定义的规则进行数据清理并存入关系数据库的过程，用户需记录该关系数据库的位置、用户名、密码的连接数据库时所用到基本信息；步骤2、配置文件阶段：配置文件分为关系数据库配置文件和机器学习配置文件，用户需要在配置文件中按照给出的标签填写相应的参数信息，具体的数据库配置文件中，“configuration”表示配置文件的开始，在“database”标签内填写有关数据库的信息，其中，用户需要在“url”中指明在步骤1中提到的数据库的位置信息，“user”表示该数据库连接时需要用到的用户名，“password”是该用户名对应的密码，“sql”是数据库查询语句；具体的机器学习配置文件中，“database”与上述的数据库配置文件中的相同，“parameter”表示调用的机器学习算法所需的除了输入参数外的其他参数，“algorithm”表示需要调用的算法名；步骤3、数据查询分析阶段：根据用户提供的配置文件信息，开始数据库查询和机器学习算法调用，除了“Con...

【技术特征摘要】
1.一种面向大数据的多范型融合分析处理方法，其特征在于，包括以下步骤：步骤1、数据预处理阶段：该阶段独立于以下业务流程阶段，是用户将所需要的数据经过用户自定义的规则进行数据清理并存入关系数据库的过程，用户需记录该关系数据库的位置、用户名、密码的连接数据库时所用到基本信息；步骤2、配置文件阶段：配置文件分为关系数据库配置文件和机器学习配置文件，用户需要在配置文件中按照给出的标签填写相应的参数信息，具体的数据库配置文件中，“configuration”表示配置文件的开始，在“database”标签内填写有关数据库的信息，其中，用户需要在“url”中指明在步骤1中提到的数据库的位置信息，“user”表示该数据库连接时需要用到的用户名，“password”是该用户名对应的密码，“sql”是数据库查询语句；具体的机器学习配置文件中，“datab...

【专利技术属性】
技术研发人员：张小旺，冯志勇，张嘉慧，
申请(专利权)人：天津大学，
类型：发明
国别省市：天津,12

全部详细技术资料下载我是这个专利的主人