一种多源电力数据融合的分布式采集系统及方法技术方案

技术编号：26259433 阅读：33 留言：0更新日期：2020-11-06 17:54

本发明专利技术提出了一种多源电力数据融合的分布式采集系统及其方法，包括主节点、工作节点、规则数据库、任务队列和持久化数据库，所述主节点查询所述任务队列状态，并通过任务调度器调度采集任务给所述工作节点；所述工作节点领取采集任务并执行；所述任务队列用来存储任务列表；所述规则数据库用来保存采集规则；所述持久化数据库保存采集的数据并进行持久化。本发明专利技术所采用的分布式采集系统和方法可以实现对多个电力数据的快速采集，有效减轻云端的压力，保证海量数据的快速采集与存储，能够保证数据采集过程中的持久化，将为数据融合快速采集到更加完整可用的电力数据。

全部详细技术资料下载

【技术实现步骤摘要】
一种多源电力数据融合的分布式采集系统及方法
本专利技术属于数据采集
，尤其涉及一种多源电力数据融合的分布式采集系统及方法。
技术介绍
电力数据融合最关键的作用在于将电力系统运行的现实情况在数字层面真实呈现，可实现从数据层面了解电力系统相关环节的实际运行情况再到深度挖掘的数据分层次应用，进而以数字化驱动电力系统精益化运营，提高对经营全貌的感知、分析和管控能力。然而随着电力物联网的发展，电力系统各个环节的数据进一步激增，呈现出数据体量大、数据类型多、数据源头多等特点，因此对于多源头海量异构数据的采集将是数据融合阶段需要解决的关键问题。传统的数据采集技术一般是通过爬虫获取数据，Scrapy是一个为了爬取网站数据、提取结构性数据而编写的应用框架，用户只需要定制开发几个模块就可以轻松的实现一个爬虫，用来抓取网页内容以及各种图片。Scrapy使用了Twisted异步网络框架来处理网络通讯，可以加快下载速度，不用自己去实现异步框架，并且包含了各种中间件接口，可以灵活的完成各种数据采集需求。scrapy最大的问题就是无法实现分布式多源数据的采集，且规则定义不够灵活，代码无法复用。
技术实现思路
针对上述问题，一方面本专利技术提出了一种多源电力数据融合的分布式采集系统，包括主节点、工作节点、规则数据库、任务队列和持久化数据库，其特征在于：所述主节点查询所述任务队列状态，并通过任务调度器调度采集任务给所述工作节点；所述工作节点领取采集任务并执行；所述任务队列用来存储任务列表；所述规则数据库用来保存采集规...

【技术保护点】
1.一种多源电力数据融合的分布式采集系统，包括主节点、工作节点、规则数据库、任务队列和持久化数据库，其特征在于：所述主节点查询所述任务队列状态，并通过任务调度器调度采集任务给所述工作节点；所述工作节点领取采集任务并执行；所述任务队列用来存储任务列表；所述规则数据库用来保存采集规则；所述持久化数据库保存采集的数据并进行持久化。/n

【技术特征摘要】
1.一种多源电力数据融合的分布式采集系统，包括主节点、工作节点、规则数据库、任务队列和持久化数据库，其特征在于：所述主节点查询所述任务队列状态，并通过任务调度器调度采集任务给所述工作节点；所述工作节点领取采集任务并执行；所述任务队列用来存储任务列表；所述规则数据库用来保存采集规则；所述持久化数据库保存采集的数据并进行持久化。

2.根据权利要求1所述的一种多源电力数据融合的分布式采集系统，其特征在于：所述任务队列包含待执行任务队列、执行中任务队列、成功任务队列和失败任务队列。

3.根据权利要求1所述的一种多源电力数据融合的分布式采集系统，其特征在于：所述采集规则包括采集类型、根据不同的采集类型对应的采集参数和解析规则。

4.根据权利要求1所述的一种多源电力数据融合的分布式采集系统，其特征在于：所述持久化数据库存储结构化数据和非结构化数据。

5.根据权利要求4所述的一种多源电力数据融合的分布式采集系统，其特征在于：所述结构化数据存储到MongoDB，所述非结构化数据存储到S3。

6.根据权利要求1所述的一种多源电力数据融合的分布式采集系统，其特征在于：所述工作节点的配置文件里...

【专利技术属性】
技术研发人员：李建彬，张彦朝，朱昊，
申请(专利权)人：华北电力大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人