一种基于低秩算法的路网交通数据的补全方法技术

技术编号:12799815 阅读:74 留言:0更新日期:2016-01-30 20:45
本发明专利技术公开一种基于低秩算法的路网交通数据的补全方法,其补全的精准度大幅提高,可以对不同类型的交通数据进行补全。这种基于低秩算法的路网交通数据的补全方法,该方法包括步骤:(1)构造包括缺失点的交通数据矩阵;(2)将低秩表示模型应用到交通数据补全中,对缺失点进行预填充;(3)加入交通数据的时序信息作为其中的约束项,从而更加精确的将缺失点补全。

【技术实现步骤摘要】

本专利技术属于智能交通的
,具体地设及一种基于低秩算法的路网交通数据 的补全方法。
技术介绍
随着城市车辆数目的持续上升,各种交通问题成为目前面临和亟待解决的难 题。为了能对交通问题有更好的分析和处理,我国的大城市快速路和主干道逐渐设立了 各种交通流参数自动获取装置,如感应线圈检测器、微波传感器、视频检测器、GPS(global positionsystem)等,用于实时采集道路交通流的信息(车速、流量、占有率等),并通过对 采集信息的分析和处理,将实时动态的信息服务于出行者。但是在对实际交通道路进行动 态的交通数据采集的过程中,由于交通传感器的硬件故障、噪声干扰或通信故障,往往会造 成数据异常和数据丢失等状况,运对交通问题的分析和解决将会产生十分不利的影响,如 交通出行的引导。因此,有效地分析交通规律,针对性地解决交通问题,就必须保证交通数 据的完整性。所W,在我们利用交通数据分析交通问题前,针对交通检测设备所采集到的数 据可能出现的问题,有必要对丢失的交通数据进行补全。 交通数据(如路段速度、车流量等)的时空相关性由交通数据的时间性和空间性 两部分构成。交通数据的时间性通常也被称作相似性,它是指同一路段上,通常在W年、月、 周、时、分为单位的周期上,交通数据会呈现出不同程度的相似性。交通数据的空间性通常 也被称作相关性,因为城市路网是W-个多方连通的复杂整体,因此各路段间的交通状态 也相互制约着,对于路网中邻近的几个路段,它们各自的交通数据随时间变化趋势通常会 比较一致。 近年来,机器学习领域吸引了越来越多的关注,其挖掘数据中隐含信息的能力为 交通数据补全引出了新的研究方向。稀疏表示基于一个原则,即一个信号往往可W由字典 中少量几个信号的线性和来表示。大量的研究致力于构造带有特定属性的字典。稀疏表示 模型在很多应用领域都取得了极大的成功,如人脸识别、图像去噪、图像超分辨率重构等。 在大多数稀疏表示方法中,人们只是独立地考虑样本的稀疏表示,然而数据间的关系和隐 含在数据集中的子空间结构却并没有被考虑。事实上,运些内在的属性在许多学习任务中 拥有非常重要的作用,特别是在样本间相关性比较强的应用中。因此,一些研究人员开始 了对数据样本集进行整体约束的研究,如低秩约束或核范数。低秩约束作为一种较为特殊 的稀疏约束已被J.Wri曲t、Y.Ma等人应用在矩阵补全模型中并取得了非常好的实验效果, 该模型要求所研究的带有数据缺失的矩阵具有低秩性,通过对矩阵中的元素经过某种线性 (非线性)运算后得到的值来对矩阵进行补全,运个过程中补全后的矩阵具有低秩性且重 构误差最小。 W05] 然而,传统的低秩约束算法,如鲁棒性主成分分析(RobustPrincipal ComponentsAnalysis,RPCA),是对重构样本集整体做低秩约束,缺乏微观上样本间的联 系,如不同应用场景下样本所特有的性质。
技术实现思路
本专利技术的技术解决问题是:克服现有技术的不足,提供一种基于低秩算法的路网 交通数据的补全方法,其补全的精准度大幅提高,可W对不同类型的交通数据进行补全。 本专利技术的技术解决方案是:运种基于低秩算法的路网交通数据的补全方法,该方 法包括W下步骤: (1)构造包括缺失点的交通数据矩阵; (2)将低秩表示模型应用到交通数据补全中,对缺失点进行预填充; (3)加入交通数据的时序信息作为其中的约束项,从而更加精确的将缺失点补全。 本专利技术将低秩表示模型应用到了交通数据补全中,加入交通数据的时序信息作为 其中的约束项,低秩表示尝试寻找数据隐藏在高维空间中的稀疏属性,通过对系数矩阵的 低秩约束,使得样本被分到不同的子空间,在子空间内对系数矩阵进行时序约束,使得子空 间内也具有相似性约束,因此补全的精准度大幅提高,可W对不同类型的交通数据进行补 全。【附图说明】 图1示出了根据本专利技术的基于低秩算法的路网交通数据的补全方法的流程图; 图2示出了基于北京公路速度数据库的数据补全相对百分误差(MAP巧; 图3示出了基于北京公路速度数据库的数据补全均方根相对误差(RISE)。【具体实施方式】 通过对交通数据的分析,发现其具有很强的时空性,为了在重构时强化运种时空 的性质,决定引入低秩表示算法。 与传统的关于低秩约束的算法直接约束重构样本本身不同,低秩算法是在样本自 表示的基础上,对系数矩阵进行低秩约束的。运样就可W对系数矩阵添加交通数据的时序 约束,即间接的对重构样本添加时序约束,使得算法更贴近交通数据补全的应用。低秩表示 尝试寻找数据隐藏在高维空间中的稀疏属性,通过对系数矩阵的低秩约束,使得样本被分 到不同的子空间,在子空间内对系数矩阵进行时序约束,使得子空间内也具有相似性约束, 因此可W更加精确的估计缺失位置的值。 为了获取交通数据中的时序信息,采用了J.Gao等人提出的一种新型的序列数据 的子空间聚类模型(0SC),该模型主要目标是从连续的子空间集合中分割数据。0SC模型旨 在寻找一组原始数据(连续视频帖)的稀疏表示,考虑到相邻的视频帖间变化很小的特点, 模型在稀疏子空间聚类的基础上加入了一个新的帖间相似约束条件,使得相邻帖的表达系 数尽可能的相似。考虑到同一路段上的一段时间内固定时间间隔所采集的交通数据具有很 强的时间相似性,所W在传统的低秩矩阵补全模型上增加时序性约束,提出了基于低秩表 示的交通数据补全模型。[001引如图1所示,运种基于低秩算法的路网交通数据的补全方法,该方法包括W下步 骤: (1)构造包括缺失点的交通数据矩阵; (2)将低秩表示模型应用到交通数据补全中,对缺失点进行预填充; (3)加入交通数据的时序信息作为其中的约束项,从而更加精确的将缺失点补全。 本专利技术将低秩表示模型应用到了交通数据补全中,加入交通数据的时序信息作为 其中的约束项,低秩表示尝试寻找数据隐藏在高维空间中的稀疏属性,通过对系数矩阵的 低秩约束,使得样本被分到不同的子空间,在子空间内对系数矩阵进行时序约束,使得子 空间内也具有相似性约束,因此补全的精准度大幅提高,可W对不同类型的交通数据进行 补全。优选地,步骤(2)、(3)结合的带有约束项的低秩表示模型为公式(1)( 1 )eΙΤ%含有噪声和数据缺失的待补全数据矩阵,D为 路段个数,Ν为连续的时间间隔数(D,Ν为变量X的维度);|| ·Ml,2表示矩阵中每一列元 素的12范数的和;ZeR胃为样本X子表示的系数;EeR重构误差矩阵,此处只使用 E的F范数约束;参数λ和β决定了各自约束项的强度,运两个参数的选择应该在误差, 秩,平滑度Ξ项中权衡,从而获得最好的实验效果。矩阵Re 1是一个=对角矩阵,矩阵 的对角线除首位元素外都为2,其上层和下层的对角线元素都为-1,ZR=[Zi_Z2, 2Z2-Zi_Z3,…,2Zn i-Zn-Zn2, Zn_ZnJ。 优选地,使用增广拉格朗日算法对公式(1)进行求解,首先将E用约束条件替换, 则公式(1)为 画(2) 分离公式(2)中的Z,令S=Z,U=SR,则公式(2)等价的转化为 闺](3) 构造公式(3)的增广拉格朗日乘子函数为 其当前第1页1 2 本文档来自技高网
...

【技术保护点】
一种基于低秩算法的路网交通数据的补全方法,其特征在于:该方法包括以下步骤:(1)构造包括缺失点的交通数据矩阵;(2)将低秩表示模型应用到交通数据补全中,对缺失点进行预填充;(3)加入交通数据的时序信息作为其中的约束项,从而更加精确的将缺失点补全。

【技术特征摘要】

【专利技术属性】
技术研发人员:张勇杜蓉刘浩王博岳尹宝才
申请(专利权)人:北京工业大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1