【技术实现步骤摘要】
一种基于ST
‑
LDA的车辆时空出行模式挖掘方法及系统
[0001]本专利技术属于智能交通
,特别是大数据利用智能交通出行
,涉及一种基于ST
‑
LDA的车辆时空出行模式挖掘方法及系统。
技术介绍
[0002]模式被定义为“某事发生或完成的重复或规则方式”。出行模式可以定义为与各种特征相关的重复出行行为,包括出行距离、出行时间、出行频率等方面的内容。在交通规划和交通管理中,了解和研究人们的出行模式,是制定适当的交通政策、优化交通网络和改善交通服务的重要前提。
[0003]现阶段,虽然已经有较多研究关注于挖掘个体出行模式并分析个体出行行为及其规律,但仍存在各种局限。有的方法利用时空数据特征进行拟合的方法,得出特征的分布规律,如幂律分布、对数分布、伽马分布和指数分布等。虽然使用分布拟合数据特征的这一类方法可以较好捕捉数据的分布特性,但是只能理解单一特征或二维特征之间的分布,无法捕捉多维特征之间的多样性和交互关系。有的研究采用聚类算法,该类算法是一种无监督学习算法,用于出行模式挖掘时,不需要预先定义出行模式,而是根据数据的相似性来识别不同的出行模式。虽然聚类算法能够挖掘出多种出行模式,但往往只能提供结果的数量和分类,不能很好地给出不同出行模式下特征的语义化解释。同时,由于聚类算法是基于数据相似性对结果进行划分,因此都是假设区域或个体只属于其中一类结果。然而,如今个体出行需求变得不再单一,区域或个体往往反映出多样的出行模式。例如,某个体出行一部分是因为通勤,一部分是因为 ...
【技术保护点】
【技术特征摘要】
1.一种基于ST
‑
LDA的车辆时空出行模式挖掘方法,其特征在于:该方法包括以下步骤:S1、数据准备:提取车辆的高速公路行程集,将其转换为行程语料库;S2、构建ST
‑
LDA模型:ST
‑
LDA模型包括两个部分:出行模式与时空特征之间的多项式分布,从语义化的特征级别增加模型的可解释性;车辆个体与出行模式之间的多项式分布,体现车辆个体的多样化出行行为;S3、模型训练:将得到的行程单词作为输入训练ST
‑
LDA模型,并使用折叠吉布斯采样方法对模型中的隐变量进行求解,得到出行模式识别结果;S4、运用模型进行车辆时空出行模式挖掘。2.根据权利要求1所述的一种基于ST
‑
LDA的车辆时空出行模式挖掘方法,其特征在于:在步骤S1中,提取车辆的高速公路行程集并将其转换为行程语料库,具体包括:S11:提取高速公路指定时间段的行程记录,根据车辆标识ID整合车辆个体的行程记录,并按照入站时间升序排列,得到车辆个体的行程记录集合;S12:将每辆车的每条行程转换为行程单词,转换完成之后,一辆车的所有行程单词构成行程文档,所有车辆的行程文档构成行程语料库。3.根据权利要求2所述的一种基于ST
‑
LDA的车辆时空出行模式挖掘方法,其特征在于:在步骤S12中,将行程转换为行程单词具体包括:(1):获取行程单词的行程时间间隔标签e;(2):获取行程单词的行程终点标签r;(3):获取行程单词的出发时间标签t;(4):获取行程单词的一周中天数标签q。4.根据权利要求3所述的一种基于ST
‑
LDA的车辆时空出行模式挖掘方法,其特征在于:在步骤S2中,ST
‑
LDA模型假设行程语料库是由以下步骤产生的:S21:对于类别为z(z=1,2,..,Z)的出行模式,从狄利克雷分布中生成相应行程单词标签的多...
【专利技术属性】
技术研发人员:郑林江,吴霄,唐毅,向光华,王世森,杨洁,刘颖,
申请(专利权)人:重庆首讯科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。