一种基于LDA模型的地铁站点功能挖掘方法技术

技术编号:17196180 阅读:129 留言:0更新日期:2018-02-03 22:52
本发明专利技术属于数据挖掘技术领域,一种基于LDA模型的地铁站点功能挖掘方法,步骤如下:1)数据收集:包括地铁刷卡数据、地铁POI数据等。经过筛选提取预处理以后,得到实验所需的潜在主题分布向量,以保证分析结果的普适性;2)语义挖掘:应用LDA主题模型,以乘客出行模式分布矩阵和POI相对含量矩阵为输入挖掘动静语义;3)站点聚类:在功能挖掘方面,本发明专利技术使用先进的聚类算法获得按功能的站点聚类簇;4)站点分类标识:本发明专利技术从类间客流转移、地理功能占比分布、簇间相似度3个角度提出站点功能标识方法,使得分析结果权威可靠。以上海地铁为例进行的地铁站点功能挖掘实验表明,本方法对于处理类似问题具有出色表现。

【技术实现步骤摘要】
一种基于LDA模型的地铁站点功能挖掘方法
本专利技术属于数据挖掘
,尤其在揭示地铁沿线区域功能、把握城市交通系统规划、建设智慧城市等领域具有重要意义,具体涉及一种基于LDA模型的地铁站点功能挖掘方法。
技术介绍
随着信息技术革命的不断深入,信息化与数字化的浪潮席卷了现代城市。然而,现代化和城市化的迅猛发展也带来了诸如交通拥堵、资源配置、环境污染等棘手问题。如今,大数据的发展为解决这些问题提供了思路和可能。利用城市大数据和城市计算为城市管理者和规划者提供有价值的信息参考,提升城市管理、服务效率,可以处理城市发展中遇到的问题和挑战。基础设施方面,传感技术的大范围扩散、智能交通系统以及基于地理位置的IT服务不但为城市生活带来了智能和极大的便捷,还使我们获得了大量的城市数据,例如人类移动轨迹信息、社会活动信息及环境信息等,同时,数据中心和云计算的建设和发展也在技术上使我们具备了处理这些大规模异构数据的能力。数据挖掘是一门结合了统计学、人工智能、机器学习和数据库系统的发现巨大的数据集中模式的计算过程,是计算机科学下的一门交叉学科。数据挖掘的总目标是从数据集中提取信息并将其转化为可理解的结本文档来自技高网...
一种基于LDA模型的地铁站点功能挖掘方法

【技术保护点】
一种基于LDA模型的地铁站点功能挖掘方法,其特征在于,步骤如下:(1)收集地铁客流数据作为乘客出行模式矩阵,收集地铁POI数据作为POI相对含量矩阵;(2)以乘客出行模式矩阵和POI相对含量矩阵为输入,应用LDA主题模型挖掘站点静动语义;(3)移动语义挖掘与位置语义挖掘a)将所有站点的出行模式的频率通过一个形为m*n的矩阵Msp来表示,其中m为站点的总数目,n为所有可能出现的出行模式的总数目;b)将站点出行模式矩阵Msp作为LDA的输入,得到一个m*k的站点功能矩阵,其中,k为潜在功能的数目,k设为20;c)建立一个m*t的站点POI矩阵MSPOI,其中m为站点的数目,t为POI类别标签数目;...

【技术特征摘要】
1.一种基于LDA模型的地铁站点功能挖掘方法,其特征在于,步骤如下:(1)收集地铁客流数据作为乘客出行模式矩阵,收集地铁POI数据作为POI相对含量矩阵;(2)以乘客出行模式矩阵和POI相对含量矩阵为输入,应用LDA主题模型挖掘站点静动语义;(3)移动语义挖掘与位置语义挖掘a)将所有站点的出行模式的频率通过一个形为m*n的矩阵Msp来表示,其中m为站点的总数目,n为所有可能出现的出行模式的总数目;b)将站点出行模式矩阵Msp作为LDA的输入,得到一个m*k的站点功能矩阵,其中,k为潜在功能的数目,k设为20;c)建立一个m*t的站点POI矩阵MSPOI,其中m为站点的数目,t为POI类别标签数目;d)对矩阵MSPOI的每一列进行min-max标准化,以将每个POI类别的数值映射到0至1之间,具体公式如下:其中,min(MSPOI[,j])表示矩阵第j列的最小值,max(MSPOI[,j])表示第j列的最大值;i=1,2,3,…,m;j=1,2,3,…,t;(4)联合步骤(3)所得移动语义及位置语义,提取每个站点的功能特征向量,得到站点功能矩阵Fa)将移动语义与位置语义作为站点两大特征,得到一个m×2k的矩阵MSF,其中m为站点的总数目,k为潜在功能的数目;b)对MSF按列进行Z-Score标准化处理,计算方法如下:其中μj为MSF第j列的期望,σj为MSF第j列的方差;c)使用稀疏主成份分析方法SPCA提取每个站点...

【专利技术属性】
技术研发人员:孔祥杰夏锋付振寰郭昊尘王进忠
申请(专利权)人:大连理工大学
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1