一种智能园区数据可视化方法及系统技术方案

技术编号:38931805 阅读:17 留言:0更新日期:2023-09-25 09:36
本发明专利技术公开了一种智能园区数据可视化方法及系统,涉及园区管理领域,该可视化方法包括以下步骤:实时采集智能园区内设备、网络和基础设施的多源数据;对多源数据进行预处理,整合为实时园区数据,并存储至消息队列;利用Spark Streaming流处理服务对实时园区数据进行分析,并基于时间序列预测模型对实时园区数据进行异常检测;基于关联规则挖掘模型挖掘历史园区数据之间的潜在关系;根据实时数据的异常检测结果和历史数据潜在关系挖掘结果。本发明专利技术采用时间序列预测模型进行异常检测有效地识别出异常数据,提高了异常检测的准确性,根据不同的数据特征和业务需求,灵活选择合适的时间序列预测模型以及参数调整方法。时间序列预测模型以及参数调整方法。时间序列预测模型以及参数调整方法。

【技术实现步骤摘要】
一种智能园区数据可视化方法及系统


[0001]本专利技术涉及园区管理领域,具体来说,涉及一种智能园区数据可视化方法及系统。

技术介绍

[0002]智能园区数据是指在园区内部采集、处理、分析和利用的各种数据,这些数据可以包括环境监测、人流监控、物联网设备信息、能源消耗情况、生产运营数据等多种类型。通过对这些数据进行深度挖掘和分析,可以实现对园区运营情况的全面了解和精细化管理,进而提升园区的效率、安全、舒适性和可持续性。智能园区数据的应用可以涉及到智慧园区建设、智慧城市建设、产业发展规划等领域。
[0003]随着5G普及和虚拟技术的发展,为智慧园区的落地提供基础支持,智能园区数据可视化的目的是将大量的数据以图形、表格或其他形式呈现出来,让人们更容易理解和分析。通过数据可视化,可以快速地发现关键信息和趋势,从而帮助企业管理者做出更加准确的决策。
[0004]但是,现有技术中的可视化技术中通常针对是园区内人员的管理,而人员通常是园区中看得到的,而园区内的数据还存在许多不易看到的数据,如能耗数据、环境监测数据、物联网设备数据等,这些数据如果不能及时有效的挖掘,将无法适应现在的园区管理,不利于推广使用。此外,只有在数据出现明显异常时,才会将该异常数据发送给管理人员进行判断和报警,导致园区管理中的异常检测不够准确化、智能化和全局化。
[0005]针对相关技术中的问题,目前尚未提出有效的解决方案。

技术实现思路

[0006]针对相关技术中的问题,本专利技术提出一种智能园区数据可视化方法及系统,以克服现有相关技术所存在的上述技术问题。
[0007]为此,本专利技术采用的具体技术方案如下:根据本专利技术的一个方面,提供了一种智能园区数据可视化方法,该可视化方法包括以下步骤:S1、实时采集智能园区内设备、网络和基础设施的多源数据;S2、对多源数据进行预处理,整合为实时园区数据,并存储至消息队列;S3、利用Spark Streaming流处理服务对实时园区数据进行分析,并基于时间序列预测模型对实时园区数据进行异常检测;S4、基于关联规则挖掘模型挖掘历史园区数据之间的潜在关系;S5、根据实时数据的异常检测结果和历史数据潜在关系挖掘结果,设计智能园区的可视化界面,并提供交互界面;并基于历史数据潜在关系挖掘结果,获取与异常检测结果存在潜在关系的相关数据信息,并选择上述相关数据信息中的关键信息与异常检测结果在可视化界面中进行重点联动展示。
[0008]进一步的实施例中,所述对多源数据进行预处理,整合为实时园区数据,并存储至
消息队列包括以下步骤:S21、对实时采集的多源数据进行数据清洗,删除无效数据和异常值;S22、将多源数据的格式转换为统一格式,并进行整合,得到实时园区数据;S23、将实时园区数据存储至Kafka消息队列。
[0009]进一步的实施例中,所述利用Spark Streaming流处理服务对实时园区数据进行分析,并基于时间序列预测模型对实时园区数据进行异常检测包括以下步骤:S31、从Kafka消息队列中读取实时园区数据;S32、使用Spark Streaming对读取到的实时园区数据进行窗口化处理,并划分为一定时间间隔的小批次数据;S33、将小批次数据按照时间顺序排列,形成一个时间序列数据;S34、从Spark Streaming处理得到的小批次数据集中,遍历每一条数据,提取需要进行统计分析的数值特征;S35、在遍历过程中,计算各数值特征的累计值及平方累计值,并记录当前小批次数据集中已处理的数据条数;S36、在遍历完成后,利用各数值特征的累计值除以数据条数,得到各特征的平均值;S37、使用各数值特征的平方累计值减去平均值的平方,再除以数据条数,得到方差,并计算方差的平方根,得到标准差;S38、根据标准差和时间序列预测模型,利用滑动窗口法对每个小批次数据进行异常检测,并识别异常数据。
[0010]进一步的实施例中,所述根据标准差和时间序列预测模型,利用滑动窗口法对每个小批次数据进行异常检测,并识别异常数据包括以下步骤:S381、设定一个系数,将标准差与系数相乘得到阈值;S382、滑动窗口法将整个时间序列数据分割成若干子窗口;S383、在每个子窗口内,利用时间序列预测模型计算预测值,并计算实际值与预测值之间的误差;S384、将计算得到的误差与阈值进行比较;S385、若误差大于阈值,则判断该实际值是异常值;S386、将所有被判断为异常值的数据点进行标记,并采取处理措施。
[0011]进一步的实施例中,所述在每个子窗口内,利用时间序列预测模型计算预测值,并计算实际值与预测值之间的误差包括以下步骤:S3831、选定时间序列预测模型,并根据时间序列数据的属性和特征进行参数调整;S3832、使用子窗口内的连续数据点作为训练数据,并将训练数据输入时间序列预测模型;S3833、利用训练好的时间序列预测模型预测子窗口后第一个数据点的实际值;S3834、利用平方误差计算预测值与实际值之间的误差。
[0012]进一步的实施例中,所述基于关联规则挖掘模型挖掘历史园区数据之间的潜在关系包括以下步骤:
S41、对收集到的历史园区数据进行数据处理,并提取与关联规则挖掘相关的特征;S42、根据特征设定关联规则挖掘所需参数,并运用Apriori算法对数据处理后的历史园区数据进行频繁项集挖掘;S43、根据挖掘得到的频繁项集,生成关联规则,并通过设定的阈值筛选出满足条件的强关联规则;S44、对挖掘得到的关联规则进行分析,结合历史园区的实际情况,从中提取有价值的信息,将有价值的信息运用到历史园区的管理与运营决策中,并据此制定相应的优化策略,以实现园区的持续改进。
[0013]进一步的实施例中,所述根据特征设定关联规则挖掘所需参数,并运用Apriori算法对数据处理后的历史园区数据进行频繁项集挖掘包括以下步骤:S421、从收集到的历史园区数据中提取与关联规则挖掘相关的特征,并设定最小支持度阈值和最小置信度阈值;S422、将处理好的历史园区数据转换为Apriori算法的输入格式,同时确定最小支持度阈值和最小置信度阈值;S423、将单个特征视为候选频繁项集,计算其支持度,根据最小支持度阈值筛选出满足条件的频繁项集;S424、将筛选出的频繁项集两两组合,计算新生成的候选频繁项集的支持度;S425、根据最小支持度阈值筛选出满足条件的频繁项集,并进行迭代,直至无法生成新的频繁项集,得到满足最小支持度阈值条件的所有频繁项集;S426、基于频繁项集生成关联规则,计算每条关联规则的置信度,根据最小置信度阈值筛选出满足条件的强关联规则。
[0014]进一步的实施例中,所述基于频繁项集生成关联规则,计算每条关联规则的置信度,根据最小置信度阈值筛选出满足条件的强关联规则包括以下步骤:S4261、遍历所有的频繁项集,将每一个频繁项集拆分为前件和后件;S4262、对于每一个前件和后件的组合,计算关联规则的置信度;S4263、根据最小置信度阈值筛选出满足条件的强关联规则,删除置信度小于最小置信度阈值的关联规则;S4264、基于频繁项集本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种智能园区数据可视化方法,其特征在于,该可视化方法包括以下步骤:S1、实时采集智能园区内设备、网络和基础设施的多源数据;S2、对多源数据进行预处理,整合为实时园区数据,并存储至消息队列;S3、利用Spark Streaming流处理服务对实时园区数据进行分析,并基于时间序列预测模型对实时园区数据进行异常检测;S4、基于关联规则挖掘模型挖掘历史园区数据之间的潜在关系;S5、根据实时数据的异常检测结果和历史数据潜在关系挖掘结果,设计智能园区的可视化界面,并提供交互界面;并基于历史数据潜在关系挖掘结果,获取与异常检测结果存在潜在关系的相关数据信息,并选择上述相关数据信息中的关键信息与异常检测结果在可视化界面中进行重点联动展示。2.根据权利要求1所述的一种智能园区数据可视化方法,其特征在于,所述对多源数据进行预处理,整合为实时园区数据,并存储至消息队列包括以下步骤:S21、对实时采集的多源数据进行数据清洗,删除无效数据和异常值;S22、将多源数据的格式转换为统一格式,并进行整合,得到实时园区数据;S23、将实时园区数据存储至Kafka消息队列。3.根据权利要求1所述的一种智能园区数据可视化方法,其特征在于,所述利用Spark Streaming流处理服务对实时园区数据进行分析,并基于时间序列预测模型对实时园区数据进行异常检测包括以下步骤:S31、从Kafka消息队列中读取实时园区数据;S32、使用Spark Streaming对读取到的实时园区数据进行窗口化处理,并划分为一定时间间隔的小批次数据;S33、将小批次数据按照时间顺序排列,形成一个时间序列数据;S34、从Spark Streaming处理得到的小批次数据集中,遍历每一条数据,提取需要进行统计分析的数值特征;S35、在遍历过程中,计算各数值特征的累计值及平方累计值,并记录当前小批次数据集中已处理的数据条数;S36、在遍历完成后,利用各数值特征的累计值除以数据条数,得到各特征的平均值;S37、使用各数值特征的平方累计值减去平均值的平方,再除以数据条数,得到方差,并计算方差的平方根,得到标准差;S38、根据标准差和时间序列预测模型,利用滑动窗口法对每个小批次数据进行异常检测,并识别异常数据。4.根据权利要求3所述的一种智能园区数据可视化方法,其特征在于,所述根据标准差和时间序列预测模型,利用滑动窗口法对每个小批次数据进行异常检测,并识别异常数据包括以下步骤:S381、设定一个系数,将标准差与系数相乘得到阈值;S382、滑动窗口法将整个时间序列数据分割成若干子窗口;S383、在每个子窗口内,利用时间序列预测模型计算预测值,并计算实际值与预测值之间的误差;S384、将计算得到的误差与阈值进行比较;
S385、若误差大于阈值,则判断该实际值是异常值;S386、将所有被判断为异常值的数据点进行标记,并采取处理措施。5.根据权利要求4所述的一种智能园区数据可视化方法,其特征在于,所述在每个子窗口内,利用时间序列预测模型计算预测值,并计算实际值与预测值之间的误差包括以下步骤:S3831、选定时间序列预测模型,并根据时间序列数据的属性和特征进行参数调整;S3832、使用子窗口内的连续数据点作为训练数据,并将训练数据输入时间序列预测模型;S3833、利用训练好的时间序列预测模型预测子窗口后第一个数据点的实际值;S3834、利用平方误差计算预测值与实际值之间的误差。6.根据权利要求1所述的一种智能园区数据可视化方法,其特征在于,所述基于关联规则挖掘模型挖掘历史园区数据之间的潜在关系包括以下步骤:S41、对收集到的历史园区数据进行数据处理,并提取与关联规则挖掘相关的特征;S42、根据特征设定关联规则挖掘所需参数,并运用Apriori算法对数据处理后的历史园区数据进行频繁项集挖掘;S43、根据挖掘得到的...

【专利技术属性】
技术研发人员:闫军徐磊郭庆雷赵旭东杨玉红范婷王东晖李保东王树森郭飞
申请(专利权)人:山东通维信息工程有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1