一种数据池对数据同步和处理的方法技术

技术编号：13457843 阅读：57 留言：0更新日期：2016-08-03 16:16

本发明专利技术的目的在于提供一种数据池对数据同步和处理技术，包括数据抽取、数据处理、数据存储、数据集市四个步骤，本方法改变了传统的计量数据存蓄、处理、查询和应用方式，实现了海量计量数据的灵活存储与实时处理，便于其他业务系统的数据实时需求，同时也实现了高效数据查询功能，提供了更加灵活的数据发布方式。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据同步和处理技术，具体涉及一种对海量数据的同步和处理的方法。
技术介绍
随着技术的进步迎来了大数据时代。所谓大数据，便是一个体量特别大，数据类别特别大的数据集，并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理的。如今时间已经走进了21世纪，各行各业已经受到科技的影响非常深。各行各业累计的数据也相当庞大，数据的价值可越来越值得研究。目前，某电科院的省级集中计量自动化系统实现计量装置在线监测和用户负荷、电量、电压等重要信息的实时采集，并且积累了海量的数据。该系统每日大概需要处理100万数据文件，对其他系统的发布数据量超过千万或近亿记录。系统目前处理数据文件的方式是通过将文件存储到关系型数据库后，再通过程序进行调度输出，在这一过程中就会存在调度延时的问题。且系统目前是采用关系型数据库处理日常的数据，当日常处理数据记录数过大时，通过数据库进行数据对象关联的过程中造成了资源的严重消耗。
技术实现思路
本专利技术的目的在于提供一种数据池对数据同步和处理的方法，本方法通过对计量自动化主站系统各类型数据进行数据抽取，并对数据进行数据传输与数据解析处理，并通过统一的数据装载模块实现数据的装载，能够实现对海量的计量自动化主站系统各类数据的同步和处理。本专利技术的目的可通过以下的技术措施来实现：一种数据池对数据同步和处理的方法，包含以下步骤：步骤1：数据抽取，从计量自...

【技术保护点】
一种数据池对数据同步和处理的方法，其特征在于包括以下步骤：步骤1：数据抽取，用于从计量自动化主站系统中抽取各类型数据，包括计算的流式数据与数据库的结构化数据；步骤2：数据处理，用于对抽取的各类型数据进行数据传输与数据解析处理；步骤3：数据存储，通过数据装载模块将抽取得到的两种不同种类的数据存储在数据池的数据仓库DW中；步骤4：数据集市，用于根据业务分析需求和业务主体分类形成不同的数据集集合。

【技术特征摘要】
1.一种数据池对数据同步和处理的方法，其特征在于包括以下步骤：
步骤1：数据抽取，用于从计量自动化主站系统中抽取各类型数据，包括计
算的流式数据与数据库的结构化数据；
步骤2：数据处理，用于对抽取的各类型数据进行数据传输与数据解析处理；
步骤3：数据存储，通过数据装载模块将抽取得到的两种不同种类的数据存
储在数据池的数据仓库DW中；
步骤4：数据集市，用于根据业务分析需求和业务主体分类形成不同的数据
集集合。
2.根据权利要求1所述的方法，其特征在于：所述的步骤1中的数据抽取
是从计量自动化主站系统中抽取各类数据到数据池；其中的数据来源主要分为两
类：计算的流式数据和数据库结构化数据。
3.根据权利要求2所述的方法，其特征在于：所述计算的流式数据包括：采
集原始表码、负荷类、告警数据；所述结构化数据包括系统档案拓扑模型、分析
对象模型和统计汇总数据。
4.根据权利要求3所述的方法，其特征在于：所述计算的流式数据的抽取过
程为：通过文件发布代理的方式抽取计量自动化主站系统的计算数据，该计算数
据是以具有一定命名规则的文本文件的形式保存。
5.根据权利要求3所述的方法，其特征在于：所述数据库结构化数据的抽取
过程为：通过调度服务模块配置抽取策略，以增量或全量的方式以一定的周期抽
取关系数据库中的表数据。
6.根据权利要求1所述的方法，其...

【专利技术属性】
技术研发人员：卢世祥，阙华坤，林国营，雷晓江，柳志明，
申请(专利权)人：广东电网有限责任公司电力科学研究院，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人