基于多维度关联的数据共享和分析方法及系统技术方案

技术编号:11831485 阅读:92 留言:0更新日期:2015-08-05 16:42
本发明专利技术提供一种基于多维度关联的数据共享和分析方法及系统,所述方法包括:建立多维度数据库,多维度数据库包括多个符合标准格式的数据集,每一数据集内包含至少一个维度。获取用户分析定义,解析用户分析定义并形成多个查询字段,从多维度数据库内获取与多个查询字段相对应的多个数据集,根据公共维度将多个数据集进行关联,形成关联结果数据集。对关联结果数据集进行计算,形成计算结果并将计算结果返回给用户。本发明专利技术提供的基于多维度关联的数据共享和分析方法及系统,集查询和计算与一体,使用方便、查询和分析效率高。进一步的,通过建立标准的数据格式,不同用户之间可实现开放式的共享,为用户提供一个开放的数据互联分析网络。

【技术实现步骤摘要】

本专利技术涉及网络数据处理领域,且特别涉及一种基于多维度关联的数据共享和分析方法及系统
技术介绍
随着互联网技术和通信技术的不断发展,如何准确、有效、实时、快速的查询到用户所需要的数据成为可当前网络数据处理的重要着力点。现有的在线数据商城,数据集和数据集之间是独立存在的,相互之间没有关联的功能。用户可以查询和下载任一数据集。另一方面,现有的公共数据查询系统和可视化平台只限于一个数据集的查询和可视化,即用户无法在线上对任何两个或两个以上的数据集进行关联分析。譬如,天气数据集和空气质量数据集是在现有的在线平台上独立存在的,用户无法在线分析天气指标和空气质量指标的关联关系。用户也无法将自己的数据集和公共数据进行关联分析。目前职业数据分析人员或企业运营分析人员当需要对两个或两个数据集进行关联分析时,需要从数据商城上下载数据集并进行二次人工分析来得到两个或两个数据集之间的关联关系。这不仅工作量大,分析复杂且分析效率低。
技术实现思路
本专利技术为了克服现有线上数据,多个数据集之间相互独立,无法将数据进行线上的关联分析的问题,提供一种基于多维度关联的数据共享和分析方法及系统。为了实现上述目的,本专利技术提供一种基于多维度关联的数据共享和分析方法包括:建立多维度数据库,多维度数据库包括多个符合标准格式的数据集,每一数据集内包含至少一个维度;获取用户分析定义,解析用户分析定义并形成多个查询字段,从多维度数据库内获取与多个查询字段相对应的多个数据集,根据公共维度将多个数据集进行关联,形成关联结果数据集;对关联结果数据集进行计算,形成计算结果并将计算结果返回给用户。于本专利技术一实施例中,每一维度对应一个维度数据结构,每一维度内的各层级属性的数据存放在相应的维度数据结构中,每一维度内各层级属性关联关系由相应的维度数据结构决定。于本专利技术一实施例中,根据每一数据集内每一维度的各层级属性形成包含所有数据集信息的数据集目录,通过查询数据集目录来实现从多维度数据库内获取与多个查询字段相对应的多个数据集。于本专利技术一实施例中,数据目录包括每一数据集的名称、对应的物理存储、使用权限、数据大小以及包含的数据字段。于本专利技术一实施例中,从多维度数据库内获取与多个查询字段相对应的多个数据集,从每一数据集内抽取出所需的数据字段形成相应的中间数据集,每个中间数据集上都包含有相关的公共维度,根据公共维度将多个中间数据集进行关联,形成关联结果数据集。于本专利技术一实施例中,每一数据集均包括多个数据列和多个设置在数据列顶部的数据字段。此外,根据本专利技术另一方面,还提供一种基于多维度关联的数据共享和分析系统,包括数据库组建单元、多维度关联引擎和计算引擎。数据库组建单元建立多维度数据库,多维度数据库包括多个符合标准格式的数据集,每一数据集内包含至少一个维度。多维度关联引擎获取用户分析定义,解析用户分析定义并形成多个查询字段,从多维度数据库内获取与多个查询字段相对应的多个数据集,根据公共维度将多个数据集进行关联,形成关联结果数据集。计算引擎对关联结果数据集进行计算,形成计算结果返回给用户。于本专利技术一实施例中,每一维度对应一个维度数据结构,每一维度内的各层级属性的数据存放在相应的维度数据结构中,每一维度内各层级属性关联关系由相应的维度数据结构决定。于本专利技术一实施例中,多维度数据库内还包括数据集目录,数据库组建单元根据每一数据集内每一维度的各层级属性形成包含所有数据集信息的数据集目录,通过查询数据集目录来实现从多维度数据库内获取与多个查询字段相对应的多个数据集。于本专利技术一实施例中,多维度关联引擎从多维度数据库内获取与多个查询字段相对应的多个数据集,并从每一数据集内抽取出所需的数据字段形成相应的中间数据集,每个中间数据集上都包含有相关的公共维度,根据公共维度将多个中间数据集进行关联,形成关联结果数据集。经由上述的技术方案可知,在本专利技术实施例中,多维度数据库内多个数据集之间或多个数据集的多个中间数据集之间具有公共维度,且公共维度符标准数据格式。多维度关联引擎通过解析用户分析定义,得到多个查询字段,根据查询字段获取多维度数据库内相对应的多个数据集并根据公共维度将多个数据集或多个中间数据集进行关联,形成关联结果数据集。最后对关联结果数据集进行计算并将计算结果返回给用户。本专利技术提供的基于多维度关联的数据共享和分析方法及系统中,多维度数据库提供了标准格式的数据集,用户在使用时只需根据该标准格式来整合数据形成数据集并将其上传到多维度数据内,不同的用户可以从多维度数据库内获取自己所需要的数据集并进行关联和计算,从而得到自己所需要的信息。本专利技术提供的基于多维度关联的数据共享和分析方法及系统,其不仅集查询和计算与一体,具有方便查询和分析效率高的优点;进一步的,其将数据集进行标准化,实现数据的开放式共享,为用户提供一个完整、方便、快速的数据互联分析网络。为让本专利技术的上述和其它目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合附图,作详细说明如下。【附图说明】图1所示为本专利技术一实施例提供的基于多维度关联的数据共享和分析方法的流程图。图2至图4所示为本专利技术一实施例中标准格式的数据集的图例。图5所示为本专利技术一实施例提供的维度数据结构图。图6所示为本专利技术一实施例提供的城市人口统计数据集。图7所示为本专利技术一实施例提供的城市每日气温数据集。图8所不为图6和图7两个数据集互联的不意图。图9所示为本专利技术一实施例提供的基于多维度关联的数据共享和分析系统的结构框图。图10所示为采用图9所示的基于多维度关联的数据共享和分析系统的工作流程图。【具体实施方式】图1所示为本专利技术一实施例提供的基于多维度关联的数据共享和分析方法的流程图。图2至图4所示为本专利技术一实施例中标准格式的数据集的图例。图5所示为本专利技术一实施例提供的维度数据结构图。图6所示为本专利技术一实施例提供的城市人口统计数据集。图7所示为本专利技术一实施例提供的城市每日气温数据集。图8所示为图6和图7两个数据集互联的示意图。图9所示为本专利技术一实施例提供的基于多维度关联的数据共享和分析系统的结构框图。图10所示为采用图9所示的基于多维度关联的数据共享和分析系统的工作流程图。请一并参阅图1至图10。目前,尽管在线数据商场上的数据集很多,但这些数据集彼此相互独立,没有任何关联。申请人通过分析这些数据集发现,尽管数据集很多,但这些数据集都被少数的几个公共维度所规定。更具体的说,大多数数据集都被时间维度和地理维度所规定,譬如,天气数据集、空气数据集、房价数据集、经济数据集、地理数据集、股票数据集等都是被时间维度或地理维度所规定。有鉴于此,本专利技术提供一种基于多维度关联的数据共享和分析方法,包括:步骤S10、建立当前第1页1 2 3 本文档来自技高网...

【技术保护点】
一种基于多维度关联的数据共享和分析方法,其特征在于,包括:建立多维度数据库,所述多维度数据库包括多个符合标准格式的数据集,每一数据集内包含至少一个维度;获取用户分析定义,解析用户分析定义并形成多个查询字段,从多维度数据库内获取与所述多个查询字段相对应的多个数据集,根据公共维度将多个数据集进行关联,形成关联结果数据集;对关联结果数据集进行计算,形成计算结果并将计算结果返回给用户。

【技术特征摘要】

【专利技术属性】
技术研发人员:韩晓南冯讯
申请(专利权)人:杭州迅涵科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1