一种交通数据弥补方法技术

技术编号：10506729 阅读：122 留言：0更新日期：2014-10-08 10:59

本发明专利技术公开一种交通数据弥补方法，该方法包括以下步骤：步骤S1：按照设定的交通数据缺失率对完整交通数据集进行随机缺失处理，获得缺失处理后的完整交通数据集；步骤S2：对缺失处理后的完整数据集和完整交通数据集进行归一化处理，得到归一化后的交通数据；步骤S3：对基于降噪堆式自动编码器深层网络结构的交通数据弥补模型进行训练，构建出弥补模型；步骤S4：调用弥补模型对输入的含缺失数据的不完整的交通数据进行弥补，得到弥补后的交通数据值。本发明专利技术将缺失数据和观测数据视为整体，以数据恢复的角度弥补交通数据，深度挖掘交通数据之间的结构关联，一次补全缺失数据，效率高，鲁棒性好。

全部详细技术资料下载

【技术实现步骤摘要】
一种交通数据弥补方法
本专利技术属于智能交通系统领域，特别涉及一种基于降噪堆式自动编码器(DenoisingStackedAutoencoders)深层网络结构的交通数据弥补方法。
技术介绍
交通数据是交通领域应用和研究的基础。个体出行者的出行规划、研究者和政府部门的交通控制与管理均需要足够的交通数据作为支持。然而，采集自实际交通系统中的交通数据往往是不完整的数据，含有部分缺失数据。这些缺失数据的存在为交通分析和研究带来诸多不便。交通数据弥补旨在尽可能准确地填补这些缺失的数据，为交通领域的应用和研究提供足够的数据支持。现有的交通数据弥补方法主要有基于时间序列分析的方法，非参数回归方法和统计学习估计方法。基于时间序列分析的方法通常使用待弥补位置的历史交通数据建立一个预测模型并预测缺失位置的数据。非参数回归方法通常使用临近位置或者临近状态的数据来估计缺失位置的数据。统计学习估计方法通常使用观测数据学习一个模型并通过迭代的模式推测缺失的数据。上述这些方法在不同的应用场景中均表现出一定的应用价值。但是这些方法的弥补误差通常会随着数据缺失率的提高而增大。而且这些方法将观测数据和缺失数据分开对待，不能充分挖掘交通数据之间的结构关联。对于数据量较大的交通数据，这些方法的弥补效率不高。
技术实现思路
(一)要解决的技术问题本专利技术的目的是解决现有技术对于数据量较大的交通数据，弥补效率低的问题，提出一种基于降噪堆式自动编码器的深层网络结构的交通数据弥补方法。(二)本专利技术的技术方案本专利技术的一种交通数据弥补方法，包括以下步骤：步骤S1：按照设定的交通数据缺失率对完整交通数...

【技术保护点】
一种交通数据弥补方法，其特征在于，该方法包括以下步骤：步骤S1：按照设定的交通数据缺失率对完整交通数据集进行随机缺失处理，获得缺失处理后的完整交通数据集；步骤S2：对缺失处理后的完整数据集和完整交通数据集进行归一化处理，得到归一化后的交通数据；步骤S3：对基于降噪堆式自动编码器深层网络结构的交通数据弥补模型进行训练，构建出弥补模型；步骤S4：调用弥补模型对输入的含缺失数据的不完整的交通数据进行弥补，得到弥补后的交通数据值。

【技术特征摘要】
1.一种交通数据弥补方法，其特征在于，该方法包括以下步骤：步骤S1：按照设定的交通数据缺失率对完整交通数据集进行随机缺失处理，获得缺失处理后的完整交通数据集；步骤S2：对缺失处理后的完整交通数据集和完整交通数据集进行归一化处理，得到归一化后的交通数据；步骤S3：对基于降噪堆式自动编码器深层网络结构的交通数据弥补模型进行训练，构建出弥补模型，所述基于降噪堆式自动编码器深层网络结构的交通数据弥补模型包括堆式自动编码器和恢复层，其中堆式自动编码器包括输入层，隐层1、隐层2、隐层3、以及它们之间的连接权重W1、W2、W3，恢复层的输入是堆式自动编码器最高层的隐层3，恢复层输出目标为缺失处理前的数据，形成一个降噪堆式自动编码器；步骤S4：调用弥补模型对输入的含缺失数据的不完整的交通数据进行弥补，得到弥补后的交通数据值。2.根据权利要求1所述的交通数据弥补方法，其特征在于，所述随机缺失处理是按照设定的交通数据缺失率，指定完整交通数据的缺失率，按照缺失率对完整交通数据进行随机缺失处理，记录缺失数据的位置，得到缺失处理后的完整交通数据集。3.根据权利要求1所述的交通数据弥补方法，其特征在于，所述归一化处理是选取完整交通数据集中交通数据的最大值Xmax，将缺失处理前后的完整交通数据集中的数据与最大值Xmax的比值作为归一化到[0，1]区间的交通数据。4.根据权利要求1所述的交通数据弥补方法，其特征在于，所选取交通数据的周期为一天。5.根据权利要求1...

【专利技术属性】
技术研发人员：王飞跃，段艳杰，吕宜生，亢文文，朱凤华，刘裕良，赵一飞，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人