一种基于城市大数据预测公共汽车出行量的方法和系统技术方案

技术编号:16270618 阅读:33 留言:0更新日期:2017-09-22 22:14
本发明专利技术公开了一种基于城市大数据预测公共汽车出行量的方法和系统,其中方法的实现包括:从城市大数据中提取样本数据,根据每条公交线路上的公交车IC卡数据,计算每条公交线路上的公共汽车出行量,并对样本数据进行关联分析,提取每条公交线路上与公交汽车出行量相关的特征集,将公共汽车出行量和特征集作为输入向量;利用输入向量对预测模型进行无监督预训练和有监督微调,得到训练好的预测模型;采集待预测线路的数据,提取待预测线路的特征集,将待预测线路的特征集输入训练好的预测模型,得到待预测线路的公交汽车出行量。本发明专利技术利用输入向量训练预测模型,可用于精准预测待预测线路未来的公共汽车出行量。

【技术实现步骤摘要】
一种基于城市大数据预测公共汽车出行量的方法和系统
本专利技术属于智慧城市领域,更具体地,涉及一种基于城市大数据预测公共汽车出行量的方法和系统。
技术介绍
随着我国城镇化进程的快速推进和经济的迅速增长,城市人口和机动车保有量激增,居民出行日益频繁,城市面临严峻的交通问题。一方面,大量的城市交通超出道路的承载能力,造成了交通拥堵,大量能源损耗和环境污染。另一方面,私人交通工具的低载运量和相对较大占用道路面积也造成了大量资源的浪费。由于城市公共交通具有承载能力大,运输效率高,能耗低和相对污染小等优点,越来越多的地区开始积极推进城市公共交通建设,大力实施公交优先发展策略,以优化城市交通结构、缓解交通拥堵、节约资源和减少交通碳排放。城市公交系统的高效运营,不仅取决于大规模基础设施的投资,更依赖于合理的运营决策和科学的管理手段。其中,高效利用城市公交系统的一个关键因素就是实时感知各个公交线路上未来某段时间的出行量。根据各个公交线路上的未来某段时间的乘客出行量,协助交通决策管理部门制定合理的运营方案,以优化城市交通,提高运输调度水平,满足人们出行的需求。然而,由于每个地区独特的地理和文化环境特征,城市各地区人们的公共汽车出行量因时间和地点而异。传统上,交通管理部门通过对各个地区的专门调查来统计各个地区的出行量,这些调查都需要耗费大量的时间和昂贵的劳动成本,并且获取数据的周期比较长,反应区域的乘客出行情况有限。由此可见,利用传统技术预测各个公交线路上的未来某段时间的乘客出行量,耗费大量的时间和昂贵的劳动成本,并且获取数据的周期比较长。
技术实现思路
针对现有技术的以上缺陷或改进需求,本专利技术提供了一种基于城市大数据预测公共汽车出行量的方法和系统,其目的在于基于城市大数据提取输入向量,利用输入向量对预测模型进行无监督预训练和有监督微调,得到训练好的预测模型,利用训练好的预测模型预测公共汽车出行量,由此解决传统技术预测各个公交线路上的未来某段时间的乘客出行量,耗费大量的时间和昂贵的劳动成本,并且获取数据的周期比较长的技术问题。为实现上述目的,按照本专利技术的一个方面,提供了一种基于城市大数据预测公共汽车出行量的方法,包括:(1)从城市大数据中提取样本数据,所述样本数据包括:公交车IC卡数据、公交车GPS数据、出租车GPS数据、城市POI静态数据和城市气象数据;(2)根据每条公交线路上的公交车IC卡数据,计算每条公交线路上的公共汽车出行量,并对样本数据进行关联分析,提取每条公交线路上与公交汽车出行量相关的特征集,将公共汽车出行量和特征集作为输入向量;(3)利用输入向量对预测模型进行无监督预训练和有监督微调,得到训练好的预测模型;(4)采集待预测线路的公交车IC卡数据、公交车GPS数据、出租车GPS数据、城市POI静态数据和城市气象数据,提取待预测线路的特征集,将待预测线路的特征集输入训练好的预测模型,得到待预测线路的公交汽车出行量。进一步的,步骤(1)还包括对样本数据中冗余和残缺的数据进行清洗。进一步的,步骤(2)中对样本数据进行关联分析的具体实现方式为:以公交线路上每个公交站点为中心取一个影响区域,利用样本数据分析每个影响区域中移动特征、地理特征和气象特征与居民出行之间的关联关系,得到特征集。进一步的,步骤(3)包括:(3-1)预测模型包括编码层和逻辑回归层,特征集和公共汽车出行量为预测模型的输入向量,公共汽车出行预测量为预测模型的输出向量;在编码层,利用输入向量进行无监督预训练,得到特征集的高层表示;(3-2)在逻辑回归层,利用特征集的高层表示得到公共汽车出行预测量,利用输入向量、公共汽车出行预测量和预测模型的参数建立损失函数,编码层用来调节预测模型参数将损失函数最小化,进行有监督微调,得到训练好的预测模型。进一步的,步骤(3-1)的具体实现方式为:预测模型包括编码层和逻辑回归层,特征集和公共汽车出行量为预测模型的输入向量,公共汽车出行预测量为预测模型的输出向量;编码层由N层去噪自动编码器组成,通过重构去噪自动编码器最小化每层输入向量的重构误差,进而对每层去噪自动编码器进行无监督训练,得到特征集的高层表示。进一步的,编码层由4层去噪自动编码器组成。进一步的,步骤(3-2)的具体实现方式为:逻辑层主要由一个逻辑回归监督学习算法构成,将特征集的高层表示输入逻辑层,得到第i条线路上的公共汽车出行预测量y(i),利用公共汽车出行预测量和第i条公交线路上的输入向量x(i),建立损失函数:其中,β是预测模型参数,D(s)表示输入向量的集合,P表示一个用于预测准确率的函数,Y表示公共汽车出行预测量的集合;编码层用来调节预测模型参数将损失函数最小化,进行有监督微调,得到训练好的预测模型。按照本专利技术的另一方面,提供了一种基于城市大数据预测公共汽车出行量的系统,包括:提取样本数据模块,用于从城市大数据中提取样本数据,所述样本数据包括:公交车IC卡数据、公交车GPS数据、出租车GPS数据、城市POI静态数据和城市气象数据;提取输入向量模块,用于根据第i条公交线路上的公交车IC卡数据,计算第i条公交线路上的公共汽车出行量,并对样本数据进行关联分析,提取第i条公交线路上与公交汽车出行量相关的特征集,将公共汽车出行量和特征集作为输入向量;训练预测模型模块,用于利用输入向量对预测模型进行无监督预训练和有监督微调,得到训练好的预测模型;进行预测模块,用于采集待预测线路的公交车IC卡数据、公交车GPS数据、出租车GPS数据、城市POI静态数据和城市气象数据,提取待预测线路的特征集,将待预测线路的特征集输入训练好的预测模型,得到待预测线路的公交汽车出行量。进一步的,训练预测模型模块包括:无监督预训练子模块,用于进行无监督预训练,预测模型包括编码层和逻辑回归层,特征集和公共汽车出行量为预测模型的输入向量,公共汽车出行预测量为预测模型的输出向量;在编码层,利用输入向量进行无监督预训练,得到特征集的高层表示;有监督微调子模块,用于在逻辑回归层,利用特征集的高层表示得到公共汽车出行预测量,利用输入向量、公共汽车出行预测量和预测模型的参数建立损失函数,编码层用来调节预测模型参数将损失函数最小化,进行有监督微调,得到训练好的预测模型。有监督微调子模块的具体执行方式为:逻辑层主要由一个逻辑回归监督学习算法构成,将特征集的高层表示输入逻辑层,得到第i条线路上的公共汽车出行预测量y(i),利用公共汽车出行预测量和第i条公交线路上的输入向量x(i),建立损失函数:其中,β是预测模型参数,D(s)表示输入向量的集合,P表示一个用于预测准确率的函数,Y表示公共汽车出行预测量的集合;编码层用来调节预测模型参数将损失函数最小化,进行有监督微调,得到训练好的预测模型。总体而言,通过本专利技术所构思的以上技术方案与现有技术相比,能够取得下列有益效果:(1)从城市中提取公交车IC卡数据、公交车GPS数据、出租车GPS数据、城市POI静态数据和城市气象数据等样本数据,有助于深入分析城市居民的出行情况;通过分析样本数据之间的关联关系,有助于提取公交线路上与公共汽车出行量密切相关的特征集;基于提取的特征集和公共汽车出行量,训练预测模型,有助于精准预测待预测线路未来的公共汽车出行量;(2)优选的,清本文档来自技高网...
一种基于城市大数据预测公共汽车出行量的方法和系统

【技术保护点】
一种基于城市大数据预测公共汽车出行量的方法,其特征在于,包括:(1)从城市大数据中提取样本数据,所述样本数据包括:公交车IC卡数据、公交车GPS数据、出租车GPS数据、城市POI静态数据和城市气象数据;(2)根据每条公交线路上的公交车IC卡数据,计算每条公交线路上的公共汽车出行量,并对样本数据进行关联分析,提取每条公交线路上与公交汽车出行量相关的特征集,将公共汽车出行量和特征集作为输入向量;(3)利用输入向量对预测模型进行无监督预训练和有监督微调,得到训练好的预测模型;(4)采集待预测线路的公交车IC卡数据、公交车GPS数据、出租车GPS数据、城市POI静态数据和城市气象数据,提取待预测线路的特征集,将待预测线路的特征集输入训练好的预测模型,得到待预测线路的公交汽车出行量。

【技术特征摘要】
1.一种基于城市大数据预测公共汽车出行量的方法,其特征在于,包括:(1)从城市大数据中提取样本数据,所述样本数据包括:公交车IC卡数据、公交车GPS数据、出租车GPS数据、城市POI静态数据和城市气象数据;(2)根据每条公交线路上的公交车IC卡数据,计算每条公交线路上的公共汽车出行量,并对样本数据进行关联分析,提取每条公交线路上与公交汽车出行量相关的特征集,将公共汽车出行量和特征集作为输入向量;(3)利用输入向量对预测模型进行无监督预训练和有监督微调,得到训练好的预测模型;(4)采集待预测线路的公交车IC卡数据、公交车GPS数据、出租车GPS数据、城市POI静态数据和城市气象数据,提取待预测线路的特征集,将待预测线路的特征集输入训练好的预测模型,得到待预测线路的公交汽车出行量。2.如权利要求1所述的一种基于城市大数据预测公共汽车出行量的方法,其特征在于,所述步骤(1)还包括对样本数据中冗余和残缺的数据进行清洗。3.如权利要求1所述的一种基于城市大数据预测公共汽车出行量的方法,其特征在于,所述步骤(2)中对样本数据进行关联分析的具体实现方式为:以公交线路上每个公交站点为中心取一个影响区域,利用样本数据分析每个影响区域中移动特征、地理特征和气象特征与居民出行之间的关联关系,得到特征集。4.如权利要求1所述的一种基于城市大数据预测公共汽车出行量的方法,其特征在于,所述步骤(3)包括:(3-1)预测模型包括编码层和逻辑回归层,特征集和公共汽车出行量为预测模型的输入向量,公共汽车出行预测量为预测模型的输出向量;在编码层,利用输入向量进行无监督预训练,得到特征集的高层表示;(3-2)在逻辑回归层,利用特征集的高层表示得到公共汽车出行预测量,利用输入向量、公共汽车出行预测量和预测模型的参数建立损失函数,编码层用来调节预测模型参数将损失函数最小化,进行有监督微调,得到训练好的预测模型。5.如权利要求4所述的一种基于城市大数据预测公共汽车出行量的方法,其特征在于,所述步骤(3-1)的具体实现方式为:预测模型包括编码层和逻辑回归层,特征集和公共汽车出行量为预测模型的输入向量,公共汽车出行预测量为预测模型的输出向量;编码层由N层去噪自动编码器组成,通过重构去噪自动编码器最小化每层输入向量的重构误差,进而对每层去噪自动编码器进行无监督训练,得到特征集的高层表示。6.如权利要求5所述的一种基于城市大数据预测公共汽车出行量的方法,其特征在于,所述编码层由4层去噪自动编码器组成。7.如权利要求4所述的一种基于城市大数据预测公共汽车出行量的方法,其特征在于,所述步骤(3-2)的具体实现方式为:逻辑层主要由一个逻辑回归监督学习算法构成,将特征集的高层表示输入逻辑层,得到第i条线路上的公共汽车出行预测量y(i),利用公共汽车出行预测量和第i...

【专利技术属性】
技术研发人员:金海余辰鲁向拥陈俊牛丽强
申请(专利权)人:华中科技大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1