基于pandas库与InfluxDB数据库的数据管理方法、系统、终端及介质技术方案

技术编号：26304055 阅读：36 留言：0更新日期：2020-11-10 19:59

本申请提供基于pandas库与InfluxDB数据库的数据管理方法、系统、终端及介质，本发明专利技术采用的是pandas库和InfluxDB数据库相结合的技术，目的在于利用pandas库对InfluxDB数据库的海量数据进行数据处理与分析，对高频刷新的海量数据有着良好的应用。由于InfluxDB数据库舍弃了数据更新和删除功能，集中强化了数据写入和查询，非常符合Pandas库的数据库接口特性，这样可以充分发挥Pandas库的数据分析和处理功能，节省了以往与传统数据库连接、读取和写入的时间。

全部详细技术资料下载

【技术实现步骤摘要】
基于pandas库与InfluxDB数据库的数据管理方法、系统、终端及介质
本申请涉及数据管理
，特别是涉及基于pandas库与InfluxDB数据库的数据管理方法、系统、终端及介质。
技术介绍
大数据发展已成趋势，同时对数据采集的规模也越来越趋向于集中式分布和群聚式采集，故而数据的存储和处理需求也在迅速增长。由于数据量庞大，所产生的数据属性也增长许多，故而传统的关系型数据库所使用的根据需求建立数据表，再通过指定数据属性存储数据的方法已经很难满足高频巨量数据的存储，且效率低下，占用资源空间大。因此，本领域亟需一种能够解决上述数据存储带来的问题，同时也能解决存储数据带来的冗余问题的技术方案。
技术实现思路
鉴于以上所述现有技术的缺点，本申请的目的在于提供基于pandas库与InfluxDB数据库的数据管理方法、系统、终端及介质，用于解决现有技术中的问题。为实现上述目的及其他相关目的，本申请的第一方面提供一种基于pandas库与InfluxDB数据库的数据管理方法，包括：定时采集...

【技术保护点】
1.一种基于pandas库与InfluxDB数据库的数据管理方法，其特征在于，包括：/n定时采集数据；/n根据数据属性分类将采集到的数据存储至带有时间标志的字典结构中，并添加字典至pandas库的dataframe结构中；/n利用python的缓存技术进行数据缓存，并利用python的treading模块设置定时线程，以将json文件中的缓存数据转码至dataframe结构中，并通过python的InfluxDB的API接口进行大批量数据写入；/n利用pandas库对缓存数据进行数据处理，并生成新的dataframe结构数据；/n对InfluxDB数据库设置数据保留策略；/n对于过期的历史数据...

【技术特征摘要】
1.一种基于pandas库与InfluxDB数据库的数据管理方法，其特征在于，包括：
定时采集数据；
根据数据属性分类将采集到的数据存储至带有时间标志的字典结构中，并添加字典至pandas库的dataframe结构中；
利用python的缓存技术进行数据缓存，并利用python的treading模块设置定时线程，以将json文件中的缓存数据转码至dataframe结构中，并通过python的InfluxDB的API接口进行大批量数据写入；
利用pandas库对缓存数据进行数据处理，并生成新的dataframe结构数据；
对InfluxDB数据库设置数据保留策略；
对于过期的历史数据，利用python脚本并开设定时任务进程，并通过pandas库和InfluxDB数据库的API接口读取过期的历史数据至dataframe数据结构中，从而以文件形式进行存储。

2.根据权利要求1所述的基于pandas库与InfluxDB数据库的数据管理方法，其特征在于，所述方法还包括：
通过pandas库和InfluxDB数据库的API接口读取指定时段的历史数据至dataframe数据结构中；
对存储至pandas库中的指定时间段历史数据进行进一步的复杂数据处理，并将数据分析结果反馈给用户。

3.根据权利要求2所述的基于pandas库与InfluxDB数据库的数据管理方法，其特征在于，所述对存储至pandas库中的指定时间段历史数据进行进一步的复杂数据处理包括：通过numpy库进行数据线性拟合；matplotlib库进行数据绘图和成像。

4.根据权利要求1所述的基于pandas库与InfluxDB数据库的数据管理方法，其特征在于，所述利用pandas库对缓存数据进行数据处理，并生成新的dataframe结构数据，包括：设置数据处理线程，将缓存数据通过pandas库的数据处理功能进行数据清洗和再转换，并生成新的dataframe结构。

5.根据权利要求1所述的基于pandas库与InfluxDB数据库的数据管理方法，其特征在于，所述数据保留策略包括历史数据的保留时限。

6.根据权利要求1所述的基于pandas库与InfluxDB数据库的数据管理方法，其特征在于，所述通过pandas库和InfluxDB数据库的API接口读取过期的历史数据至dataframe数据...

【专利技术属性】
技术研发人员：尚德华，谢思奇，
申请(专利权)人：傲普上海新能源有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人