【技术实现步骤摘要】
feature_data ON traffic_data.timestamp = feature_data.feature_timestamp
;其中,
traffic_data
表示人流量数据表,
feature_data
表示特征数据表,
timestamp
表示时间戳字段,
traffic_volume
表示人流量字段,
feature_timestamp
表示特征时间戳字段,
feature
表示特征字段;
SELECT traffic_volume, feature
:表示选择
traffic_data
表中的
traffic_volume
字段和
feature_data
表中的
feature
字段作为结果集
。FROM traffic_data JOIN feature_data
:表示从
traffic_data
表和
feature_data
表中获取数据;
ON traffic_data.timestamp
:表示按照
traffic_data
表中的
timestamp
字段进行连接;
= feature_data.feature_timestamp
:表示连接条件是
traffic_data
表中的
timestamp ...
【技术保护点】
【技术特征摘要】
1.
一种基于大数据的大型活动人流量预测方法,其特征在于,包括以下步骤:步骤
S1:
获取相关大型活动的历史数据,包括历史人流量数据
、
天气数据
、
交通数据
、
社交媒体数据;步骤
S2
:对采集到的数据进行预处理;步骤
S3:
对预处理后的数据进行特征提取,并将不同来源的数据进行合并,得到初始数据集;步骤
S4:
构建时间序列模型,并基于初始数据集训练,得到人流量预测模型;步骤
S5
:基于人流量预测模型对未来的人流量进行预测,并实时监控和更新预测结果;所述时间序列模型采用
ARIMA
模型,具体构建如下:构建初始
ARIMA
模型:
Yt = c + ∑
φ
i*Yt
‑
i + ∑
θ
i*
ε
t
‑
i + ε
t
其中,
Yt
表示时间
t
的人流量数据,
c
表示常数项,
φ
i
表示自回归系数,
θ
i
表示移动平均系数,
ε
t
表示时间
t
的误差项
,i
表示
i
个单位的时间点;将初始数据集分为训练集和测试集;并基于训练集训练初始
ARIMA
模型,得到训练后的
ARIMA
模型;使用
MAE
作为损失函数,基于测试集对训练后的
ARIMA
模型进行评估:
MAE = 1/n * ∑|y_pred
ꢀ‑ꢀ
y_true|
其中,
n
表示测试集样本数量,
y_pred
表示模型预测结果,
y_true
表示真实值;基于贝叶斯优化,优化训练后的
ARIMA
模型的自回归系数
φ
i
和移动平均系数
θ
i
的数量和取值,得到最终的人流量预测模型;所述贝叶斯优化,具体如下:将
MAE
作为目标函数,并预设
φ
i
和
θ
i
的取值范围和数量,作为参数空间;使用贝叶斯优化库初始化一个优化器对象,并设置优化器的目标函数和参数空间;调用优化器的
optimize()
方法,开始优化过程;优化器将根据目标函数的评估结果,自动选择下一组参数进行评估;优化器会迭代地进行参数调整和评估,直到达到指定的迭代次数或收敛条件;所述步骤
S5
具体为:设定一个循环,每隔预设时间间隔进行以下步骤:
a.
获取当前时间;
b.
获取最新的观测值,通过实时监测人流量来获取;
c. 使用人流量预测模型预测未来的人流量;
d. 将最新的观测...
【专利技术属性】
技术研发人员:刘世泉,蓝永文,
申请(专利权)人:福建天创信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。