电网时序大数据存储方法技术

技术编号：10815078 阅读：119 留言：0更新日期：2014-12-24 19:22

本发明专利技术公开了一种电网时序大数据存储方法，通过选择开源分布式列式数据库HBase作为存储层，结合电网业务中SG-CIM模型对业务逻辑上具有位置相关性的一批测点信息重新进行描述，通过设计一种合理的测点数据存储表的索引组织方式，利用HBase的分区和负载均衡功能，使得业务逻辑上具有位置相关性的一批测点的历史数据在物理存储上的位置是相邻的，从而使得对该批测点的历史数据进行查询时能够减少磁盘寻道时间，提高查询效率，为业务应用提供即时查询服务。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种，通过选择开源分布式列式数据库HBase作为存储层，结合电网业务中SG-CIM模型对业务逻辑上具有位置相关性的一批测点信息重新进行描述，通过设计一种合理的测点数据存储表的索引组织方式，利用HBase的分区和负载均衡功能，使得业务逻辑上具有位置相关性的一批测点的历史数据在物理存储上的位置是相邻的，从而使得对该批测点的历史数据进行查询时能够减少磁盘寻道时间，提高查询效率，为业务应用提供即时查询服务。【专利说明】
本专利技术涉及一种电网业务中对位置信息敏感的时间序列大数据存储、即时查询方法，属于大数据存储、分布式实时数据库领域。
技术介绍
随着智能化、信息化的不断发展，时序大数据管理系统作为大型流程工业企业生产信息化的重要基础数据平台，面临越来越多的挑战。以电力系统为例，一方面是超大规模数据处理的巨大压力。国家电网公司SG-ERP建设中海量历史/实时数据管理平台建设的不断深化，其数据规模越来越大，其中测点(数据采集点)规模预计将达到千万甚至上亿规模，数据存储容量到达PB字节以上。另一方面是高速实时数据处理。以WAMS系统为例，每秒需要处理的事务数可达到一千万，常规的关系数据库根本无法应对如此高速实时数据处理的挑战，对实时数据库的处理规模、处理速度提出了更高的要求。传统实时数据库受制于其传统的软件体系架构，在数据规模、处理能力、并行计算、负载均衡、动态自治等方面已无法满足实际应用需求。在实时数据库领域，引入大数据处理技术来解决上述问题是当前研究时序大数据存储的主要方法。然而，在譬如电网事故反演、电网业务告...

【技术保护点】
一种电网时序大数据存储方法，其特征在于，包括如下步骤：(1)基于SG‑CIM模型的业务逻辑层测点描述以SG‑CIM模型为基础对业务逻辑上具有位置相关性的一批测点重新进行描述，通过测量对象和测点之间的关联，形成测点的层次关系；在该描述中，SG‑CIM模型为树型结构，其中叶子节点为测点，非叶子节点之间的层次数由用户根据实际需要增加或减少；从该树的根节点到叶子节点的父节点所经过的路径用于描述测量对象；叶子节点用于表示该测量对象的测量项；一条数据记录由测量对象标识、时间戳、测量值、标签构成，其中标签由键值对描述；(2)建立测点数据存储表的索引组织选择开源分布式列式数据库HBase作为存储层；批量查询测点数据存储表的索引模式设计为：测量对象标识+基准时间+标签，其中测量对象标识采用基于SG‑CIM模型对逻辑业务上具有位置相关性的一批测点的重新描述；基准时间的选定，是根据待存储测量对象的数据采集频率来决定该基准时间是整小时/整天；列是以采集数据记录的时间戳相对于基准时间的偏移量；断面查询测点数据存储表的索引模式设计为：时间戳+测量对象标识+标签，其中时间戳为采集到每条数据记录的时间戳。

【技术特征摘要】

【专利技术属性】
技术研发人员：王远，袁军，刘琛，胡健，张珂珩，
申请(专利权)人：江苏瑞中数据股份有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人