基于大数据的大型活动人流量预测方法技术

技术编号：39782858 阅读：8 留言：0更新日期：2023-12-22 02:25

本发明专利技术涉及一种基于大数据的大型活动人流量预测方法，包括以下步骤：步骤

全部详细技术资料下载

【技术实现步骤摘要】
feature_data ON traffic_data.timestamp = feature_data.feature_timestamp
；其中，
traffic_data
表示人流量数据表，
feature_data
表示特征数据表，
timestamp
表示时间戳字段，
traffic_volume
表示人流量字段，
feature_timestamp
表示特征时间戳字段，
feature
表示特征字段；
SELECT traffic_volume, feature
：表示选择
traffic_data
表中的
traffic_volume
字段和
feature_data
表中的
feature
字段作为结果集
。FROM traffic_data JOIN feature_data
：表示从
traffic_data
表和
feature_data
表中获取数据；
ON traffic_data.timestamp
：表示按照
traffic_data
表中的
timestamp
字段进行连接；
= feature_data.feature_timestamp
：表示连接条件是
traffic_data
表中的
timestamp...

【技术保护点】

【技术特征摘要】
1.
一种基于大数据的大型活动人流量预测方法，其特征在于，包括以下步骤：步骤
S1:
获取相关大型活动的历史数据，包括历史人流量数据
、
天气数据
、
交通数据
、
社交媒体数据；步骤
S2
：对采集到的数据进行预处理；步骤
S3:
对预处理后的数据进行特征提取，并将不同来源的数据进行合并，得到初始数据集；步骤
S4:
构建时间序列模型，并基于初始数据集训练，得到人流量预测模型；步骤
S5
：基于人流量预测模型对未来的人流量进行预测，并实时监控和更新预测结果；所述时间序列模型采用
ARIMA
模型，具体构建如下：构建初始
ARIMA
模型：
Yt = c + ∑
φ
i*Yt
‑
i + ∑
θ
i*
ε
t
‑
i + ε
t
其中，
Yt
表示时间
t
的人流量数据，
c
表示常数项，
φ
i
表示自回归系数，
θ
i
表示移动平均系数，
ε
t
表示时间
t
的误差项
,i
表示
i
个单位的时间点；将初始数据集分为训练集和测试集；并基于训练集训练初始
ARIMA
模型，得到训练后的
ARIMA
模型；使用
MAE
作为损失函数，基于测试集对训练后的
ARIMA
模型进行评估：
MAE = 1/n * ∑|y_pred
ꢀ‑ꢀ
y_true|
其中，
n
表示测试集样本数量，
y_pred
表示模型预测结果，
y_true
表示真实值；基于贝叶斯优化，优化训练后的
ARIMA
模型的自回归系数
φ
i
和移动平均系数
θ
i
的数量和取值，得到最终的人流量预测模型；所述贝叶斯优化，具体如下：将
MAE
作为目标函数，并预设
φ
i
和
θ
i
的取值范围和数量，作为参数空间；使用贝叶斯优化库初始化一个优化器对象，并设置优化器的目标函数和参数空间；调用优化器的
optimize()
方法，开始优化过程；优化器将根据目标函数的评估结果，自动选择下一组参数进行评估；优化器会迭代地进行参数调整和评估，直到达到指定的迭代次数或收敛条件；所述步骤
S5
具体为：设定一个循环，每隔预设时间间隔进行以下步骤：
a.
获取当前时间；
b.
获取最新的观测值，通过实时监测人流量来获取；
c. 使用人流量预测模型预测未来的人流量；
d. 将最新的观测...

【专利技术属性】
技术研发人员：刘世泉，蓝永文，
申请(专利权)人：福建天创信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人