基于大数据的大型活动人流量预测方法技术

技术编号:39782858 阅读:8 留言:0更新日期:2023-12-22 02:25
本发明专利技术涉及一种基于大数据的大型活动人流量预测方法,包括以下步骤:步骤

【技术实现步骤摘要】
feature_data ON traffic_data.timestamp = feature_data.feature_timestamp
;其中,
traffic_data
表示人流量数据表,
feature_data
表示特征数据表,
timestamp
表示时间戳字段,
traffic_volume
表示人流量字段,
feature_timestamp
表示特征时间戳字段,
feature
表示特征字段;
SELECT traffic_volume, feature
:表示选择
traffic_data
表中的
traffic_volume
字段和
feature_data
表中的
feature
字段作为结果集
。FROM traffic_data JOIN feature_data
:表示从
traffic_data
表和
feature_data
表中获取数据;
ON traffic_data.timestamp
:表示按照
traffic_data
表中的
timestamp
字段进行连接;
= feature_data.feature_timestamp
:表示连接条件是
traffic_data
表中的
timestamp
字段等于
feature_data
表中的
feature_timestamp
字段

[0007]进一步的,所述时间序列模型采用
ARIMA
模型,具体构建如下:构建初始
ARIMA
模型:
Yt = c + ∑
φ
i*Yt

i + ∑
θ
i*
ε
t

i + ε
t
其中,
Yt
表示时间
t
的人流量数据,
c
表示常数项,
φ
i
表示自回归系数,
θ
i
表示移动平均系数,
ε
t
表示时间
t
的误差项;将初始数据集分为训练集和测试集;并基于训练集训练初始
ARIMA
模型,得到训练后的
ARIMA
模型;使用
MAE
作为损失函数,基于测试集对训练后的
ARIMA
模型进行评估:
MAE = 1/n * ∑|y_pred
ꢀ‑ꢀ
y_true|
其中,
n
表示测试集样本数量,
y_pred
表示模型预测结果,
y_true
表示真实值;基于贝叶斯优化,优化训练后的
ARIMA
模型的自回归系数
φ
i
和移动平均系数
θ
i
的数量和取值,得到最终的人流量预测模型

[0008]进一步的,所述贝叶斯优化,具体如下:将
MAE
作为目标函数,并预设
φ
i

θ
i
的取值范围和数量,作为参数空间;使用贝叶斯优化库初始化一个优化器对象,并设置优化器的目标函数和参数空间;调用优化器的
optimize()
方法,开始优化过程;优化器将根据目标函数的评估结果,自动选择下一组参数进行评估;优化器会迭代地进行参数调整和评估,直到达到指定的迭代次数或收敛条件

[0009]进一步的,所述步骤
S5
具体为:设定一个循环,每隔预设时间间隔进行以下步骤:
a.
获取当前时间;
b.
获取最新的观测值,通过实时监测人流量来获取;
c. 使用人流量预测模型预测未来的人流量;
d.
将最新的观测值添加到训练集中,并重新训练人流量预测模型;
e. 基于重新训练人流量预测模型预测结果,包括当前时间和预测的人流量

[0010]本专利技术具有如下有益效果:
1.
本专利技术综合考虑历史人流量数据

天气数据

交通数据

社交媒体数据,并将数据进行整合,然后对
ARIMA
模型进行训练得到人流量预测模型, 能够更准确地预测未来的人流量;
2.
本专利技术的人流量预测模型根据实时情况对预测结果进行调整和更新,更好地适应不断变化的人流量需求,相比于传统的静态模型,预测的准确度和实时性更好

附图说明
[0011]图1为本专利技术方法流程图

具体实施方式
[0012]以下结合附图和具体实施例对本专利技术做进一步详细说明:参考图1,本专利技术提供一种基于大数据的大型活动人流量预测方法,包括以下步骤:步骤
S1:
获取相关大型活动的历史数据,包括历史人流量数据

天气数据

交通数据

社交媒体数据;步骤
S2
:对采集到的数据进行预处理;步骤
S3:
对预处理后的数据进行特征提取,并将不同来源的数据进行合并,得到初始数据集;步骤
S4:
构建时间序列模型,并基于初始数据集训练,得到人流量预测模型;步骤
S5
:基于人流量预测模型对未来的人流量进行预测,并实时监控和更新预测结果

[0013]在本实施例中,获取相关大型活动的历史数据,包括历史人流量数据

天气数据

交通数据

社交媒体数据,具体如下:通过安装传感器或监控摄像头来收集历史人流量数据

例如,在一个购物中心中安装传感器,每小时记录进入和离开的人数

历史人流量数据可以表示为一个时间序列,例如:时间
ꢀꢀꢀꢀꢀꢀꢀꢀ
人流量
2023

01

01
ꢀꢀ
100002023

01

02
ꢀꢀ
150002023

01

03
ꢀꢀ
20000...
天气数据:可以从气象局

气象传感器或气象网站获取天气数据

例如,获取每小时的温度和降雨量数据

天气数据可以表示为一个时间序列,例如:时间
ꢀꢀꢀꢀꢀꢀꢀꢀ
温本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于大数据的大型活动人流量预测方法,其特征在于,包括以下步骤:步骤
S1:
获取相关大型活动的历史数据,包括历史人流量数据

天气数据

交通数据

社交媒体数据;步骤
S2
:对采集到的数据进行预处理;步骤
S3:
对预处理后的数据进行特征提取,并将不同来源的数据进行合并,得到初始数据集;步骤
S4:
构建时间序列模型,并基于初始数据集训练,得到人流量预测模型;步骤
S5
:基于人流量预测模型对未来的人流量进行预测,并实时监控和更新预测结果;所述时间序列模型采用
ARIMA
模型,具体构建如下:构建初始
ARIMA
模型:
Yt = c + ∑
φ
i*Yt

i + ∑
θ
i*
ε
t

i + ε
t
其中,
Yt
表示时间
t
的人流量数据,
c
表示常数项,
φ
i
表示自回归系数,
θ
i
表示移动平均系数,
ε
t
表示时间
t
的误差项
,i
表示
i
个单位的时间点;将初始数据集分为训练集和测试集;并基于训练集训练初始
ARIMA
模型,得到训练后的
ARIMA
模型;使用
MAE
作为损失函数,基于测试集对训练后的
ARIMA
模型进行评估:
MAE = 1/n * ∑|y_pred
ꢀ‑ꢀ
y_true|
其中,
n
表示测试集样本数量,
y_pred
表示模型预测结果,
y_true
表示真实值;基于贝叶斯优化,优化训练后的
ARIMA
模型的自回归系数
φ
i
和移动平均系数
θ
i
的数量和取值,得到最终的人流量预测模型;所述贝叶斯优化,具体如下:将
MAE
作为目标函数,并预设
φ
i

θ
i
的取值范围和数量,作为参数空间;使用贝叶斯优化库初始化一个优化器对象,并设置优化器的目标函数和参数空间;调用优化器的
optimize()
方法,开始优化过程;优化器将根据目标函数的评估结果,自动选择下一组参数进行评估;优化器会迭代地进行参数调整和评估,直到达到指定的迭代次数或收敛条件;所述步骤
S5
具体为:设定一个循环,每隔预设时间间隔进行以下步骤:
a.
获取当前时间;
b.
获取最新的观测值,通过实时监测人流量来获取;
c. 使用人流量预测模型预测未来的人流量;
d. 将最新的观测...

【专利技术属性】
技术研发人员:刘世泉蓝永文
申请(专利权)人:福建天创信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1