基于机器学习与协同过滤的交通流自适应预测方法技术

技术编号：37968307 阅读：6 留言：0更新日期：2023-06-30 09:43

本发明专利技术公开了一种基于机器学习与协同过滤的交通流自适应预测方法。本发明专利技术利用数据驱动的非参数机器学习模型库对城市道路流量分进口道、分时段进行预测。摒弃了全局最优预测模型方案，在多种模型中择优进行选择，保证了每个进口道不同时段能有最优的预测效果；并且在模型库中加入了预测性能更好的深度学习模型LSTMs，提高了预测精度上限。本发明专利技术利用协同过滤的思想，只须用部分进口道进行全模型训练，即可达到所有进口道获得最优模型的效果。避免了所有进口道进行深度学习模型的训练，节省了算力和训练时间。省了算力和训练时间。省了算力和训练时间。

全部详细技术资料下载

【技术实现步骤摘要】
基于机器学习与协同过滤的交通流自适应预测方法

[0001]本专利技术涉及一种基于机器学习模型和协同过滤算法的城市道路短时交通流自适应预测方法，属于智能交通领域，尤其属于智能交通中的交通流预测

技术介绍

[0002]随着社会和经济的发展，城市化进程快速推进，城市机动车保有量快速增长，交通拥堵问题日益严重。为了保证城市交通的健康平稳运行，智能交通系统应运建立起来。而短时交通流预测技术就是智能交通系统的关键组成部分，应用于实时信号控制、路径诱导、自动导航等模块。
[0003]短时交通流预测通常指的是交通流量的短时预测，预测时间一般限定在15分钟内。经过几十年的研究和发展，短时交通流预测模型领域诞生了许多模型，例如基于简单规则的历史趋势平均模型、基于线性回归以及卡尔曼滤波等数学模型的参数模型、数据驱动的非参数机器学习模型。随着近年交通检测器的快速发展和广泛应用，交通数据储存能力和处理能力的提高，基于机器学习的交通流短时预测研究成为热点。主要的非参数机器学习模型包括K最近邻、支持向量回归、神经网络等等。堆栈式长短期记忆神经网络(LSTMs,Stacked Long Short
‑
Term Memory Networks)是循环神经网络的一种变体，属于深度学习模型，在时间序列建模问题上有一定的优势，具有长时记忆能力，常用于交通流预测。深度学习模型一般来说预测精度高于其它机器学习模型，但需要更多的数据、更长的时间进行训练，对算力的要求很高。
[0004]协同过滤算法是目前应用广泛的推荐算...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习与协同过滤的交通流自适应预测方法，其特征在于，包括以下步骤：步骤1：建立用于机器学习模型训练的训练集以及测试集；步骤2：基于训练集以及测试集构建用于输入机器学习模型的特征矩阵，该特征矩阵包含流量信息、对应时段的工作日/非工作日信息以及对应的时段信息；步骤3：建立模型精度p的计算公式，如下式所示：式中，MAPE为基于平均绝对百分比误差转化计算得到的模型精度指标；步骤4：构建包含多个非参数机器学习模型以及一个深度学习模型的模型库；步骤5：确定不同进口道流量预测在不同时段的优势模型，包括以下步骤：步骤501：将N个进口道划分为两个进口道集合，分别表示为进口道集合C1以及进口道集合C2；步骤502：对属于进口道集合C1的进口道，利用训练集对模型库中的所有模型进行全模型的训练；训练完成后，利用测试集分T个时段对模型的预测精度进行计算，则获得进口道集合C1中各个进口道在每种模型下不同时段的预测精度三维数组为P
i*m*t
，其中，i为进口道编号，i∈C1；m表示模型库中的第m种模型；t为时段种类，t∈T；对属于进口道集合C2中的进口道，利用训练集对模型库中除去深度学习模型外的其他模型进行训练；训练完成后，利用测试集分T个时段对模型的预测精度进行计算，则获得进口道集合C2中各个进口道在除去深度学习模型外的其他模型下不同时段的预测精度数组P
j*m*t
，其中，j为进口道编号，j∈C2；m表示模型库中除深度学习模型外的第m种模型；t为时段种类，t∈T；步骤503：根据预测精度数组获取优势模型，并保存优势模型，最终得到分别属于进口道集合C1以及进口道集合C2不同进口道流量预测在不同时段的优势模型步骤6：参考皮尔逊相关系数计算公式对进口道间的相似度进行计算：步骤6：参考皮尔逊相关系数计算公式对进口道间的相似度进行计算：步骤6：参考皮尔逊相关系数计算公式对进口道间的相似度进行计算：式中，S
i*j
为进口道集合C1中的进口道i和进口道集合C2中的进口道j之间的相似度；p
imt
、p
jmt
分别为进口道i、进口道j基于预测模型m在预测时段t的流量预测精度，i∈C1，j∈C2；分别为进口道i、进口道j的精度平均值；n
M
为模型库中非参数机器学习模型的数量、n
T
为时段个数；步骤7：基于步骤6计算得到的相似度获得进口道集合C1中的进口道i和进口道集合C2中的进口道j之间的相似度矩阵S
i*j
，遍历相似度矩阵S
i*j
的每一列得到最终的优势模型其中，对于相似度矩阵S
i*j
中的当前一列，有：
获取相似度矩阵S
i*j

【专利技术属性】
技术研发人员：谈佳睿，还斌，赵益，王柏豪，龚俍俍，赵超，
申请(专利权)人：上海衍之辰科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人