一种公共自行车系统租赁点功能聚类方法技术方案

技术编号:15747742 阅读:123 留言:0更新日期:2017-07-03 05:51
本发明专利技术公开了一种公共自行车系统租赁点功能聚类方法。本发明专利技术包含以下步骤:步骤1、对于公共自行车系统,首先利用租赁点位置信息,采用泰森多边形算法对城市进行区域划分,每个租赁点覆盖一定的区域,将每个租赁点看做一个“文本”进行挖掘分析。步骤2、将公共自行车系统的使用历史记录转换为该租赁点所包含的“单词”。步骤3、使用LDA算法和K‑means算法对租赁点进行租赁点功能识别。步骤4、对每个聚类结果进行时空特征分析,定义每种聚类包含的那些租赁点所代表的功能。本发明专利技术的积极效果是:为公共自行车未来的规划提出依据;指导用户使用公共自行车;可以指导商业和广告的建立,具有较好的行业应用前景。

Public bicycle system rental point function clustering method

The invention discloses a functional clustering method of a public bicycle system lease point. The invention comprises the following steps: 1, the first public bicycle system, using rental location information, using the Tyson polygon algorithm to partition the city, each rental coverage of certain areas, each rental as a text mining analysis. Step 2 translate the usage history of the public bicycle system to the words included in the lease point\. Step 3, using the LDA algorithm and K means algorithm function identification of the rental lease. Step 4. Analyze the temporal and spatial features of each clustering result, defining the functions represented by the lease points contained in each cluster. The positive effect of the invention is that the utility model provides the basis for the future planning of the public bicycle; guides the user to use the public bicycle; can guide the establishment of the business and the advertisement, and has a better application prospect in the industry.

【技术实现步骤摘要】
一种公共自行车系统租赁点功能聚类方法
本专利技术属于交通规划中公共自行车系统规划领域,尤其涉及一种公共自行车系统租赁点功能聚类方法。
技术介绍
城区的功能识别是指利用城市运行数据和动态特征,对于城市的各个不同区域按照其在城市中所承担的功能进行识别和标注。它是城市规划的主要组成部分,可以帮助人们了解城市内在的发展规律,开展城市规划,指导城市建设发展。但是,城市功能区域发现这类研究是十分困难的:城市居民活动复杂,城市功能区域并不单一,所以很难准确定义一块区域的具体功能;传统的方法多为用户调研,实地统计,这无疑是非常耗时、耗力;而最近采用的研究对象——城市数据的种类繁多、规模庞大、多粒度、多维度等特征,想要从中发现规律是非常困难的;由于城市功能区域本身不能直接观测,所以很难去验证算法的有效性和正确性。随着公共自行车系统的普及和发展,积累了越来越多的使用数据,公共自行车系统的使用记录数据蕴含着丰富的人群移动信息:不仅蕴含了用户的移动,而且它反应出了用户在不同的时间不同的地点的社会经济活动。租赁点所具有的功能和城市的区域功能具有相似性,都是用户为了满足一定的目的,在空间和时间上进行聚集。开展城市区域功能发现是一项繁重的任务,公共自行车系统的使用用户只是城市中的一小部分居民,通过这些数据去进行城市功能区域发现无疑是不准确的,但是本专利技术提出了的方法不是去进行城市功能区域发现,而是根据使用数据去对租赁点进行功能聚类,识别租赁点的使用模式,进而以便于系统管理者进行车站平衡调度和新租赁点的部署等。区别于其它文献的公共自行车聚类算法,本专利技术提出的算法充分考虑到用户的使用模式反应了租赁点的功能特征,从用户积累的使用数据角度对租赁点进行聚类。LDA(LatentDirichletAllocation)模型作为一种机器学习技术,可以挖掘出文本中潜在的隐含信息,本专利技术将每个租赁点作为一个文本,用户在租赁点发生的借/还车行为作为文本的单词,文本的主题作为租赁点所具有的功能。同时,为了进一步得出聚类结果,利用k-means算法对LDA模型产生的主题分布概率进行聚类。总的说来,现有的公共自行车聚类方法只是利用租赁点的位置属性和单个站点的使用数据进行聚类,但公共自行车系统是为用户服务并且各个租赁点和其它租赁点间具有相关性,应充分利用租赁点之间的联系,采用数据挖掘算法可进一步提高聚类的有效性。结合LDA模型和k-means算法可以有效解决公共自行车系统租赁点功能聚类问题。
技术实现思路
本专利技术的目的是针对现有技术的不足,为了充分融合LDA与k-means的优点,提高公共自行车功能聚类的有效性,本专利技术提出了一种公共自行车系统租赁点功能聚类方法。本专利技术解决其技术问题所采的技术方案包含以下步骤:步骤1、对于公共自行车系统,首先利用租赁点位置信息,采用泰森多边形算法对城市进行区域划分,每个租赁点覆盖一定的区域,将每个租赁点看做一个“文本”进行挖掘分析。步骤2、将公共自行车系统的使用历史记录转换为该租赁点所包含的“单词”。步骤3、使用LDA模型和K-means算法对租赁点进行租赁点功能识别。步骤4、对每个聚类结果进行时空特征分析,定义每种聚类包含的那些租赁点所代表的功能。步骤2所述的将公共自行车系统的使用历史记录转换为该租赁点所包含的“单词”,具体操作如下:2-1.定义每个乘客的一次出行产生的记录为TS,TS=(TS.SO,TS.tO,TS.SD,TS.tD),其中,TS.SO表示借车站点,TS.SD表示还车站点,TS.tO表示借车时刻,TS.tD表示还车时刻。2-2.由于用户能够在任意租赁点租借/归还自行车,因此设置两种客流模式:租借模式、归还模式;定义MO为租借模式:MO=(TS.SO,TS.SD,TS.tO);定义MD为归还模式:MD=(TS.SO,TS.SD,TS.tD)。2-3.对每个租赁点设置两种使用模式,分别为租借模式和归还模式,分别定义为XSO、XSD。根据用户的客流模式得出所有租赁点s(1…S)的使用模式向量:XSO=(CO1,CO2,…,COs,…,COS);XSD=(CD1,CD2,…,CDs,…,CDS)。其中,COs为在编号为s的租赁点发生租借行为的所有记录,COs=||{MO={x,y,z}|x=s,y=i,z=k||,COs它是一个S×T矩阵,表示在时间点(1…k··T)内,从编号为s的租赁点借车,到编号为(1··i··S)的租赁点还车发生的记录统计量;同理,CDs为在编号为s的租赁点发生还车行为的所有记录,CDs=||{MD={x,y,z}|x=i,y=s,z=k||,它是一个S×T矩阵,表示在时间点(1…k··T)内,从编号为(1··i··S)的租赁点借车,到编号为s的租赁点还车发生的记录统计量。2-4.将每一个租赁点作为一个文档,租赁点对应的区域功能视作文档的主题,租赁点的使用模式相当于组成每篇文档的单词。如同每篇文档的每个词都是通过“以一定概率选择了某个主题,并从这个主题中以一定概率选择某个词语”这样一个过程得到,租赁点的用户出行模式也可以推导出租赁点所在区域的功能。公共自行车系统一共有S个租赁点,设研究的文档个数也为S篇。根据租赁点的使用模式向量XSO和XSD,得出任意一个租赁点的组成内容为Cs=(WOs,WDs)。以编号为i的租赁点为例来说明一篇文档的单词是如何计算的,编号为i的租赁点的定义单词为WOi=COi,WDi=CDi。在时刻t时,从编号为i的租赁点借车去到租赁点编号为s(1,2,…,..,S)的租赁点还车的记录有M条,表示租赁点i有M个WOi=(i,s,t)这样的单词;在时刻t时,从编号为s(1,2,…,..,S)的租赁点借车去到租赁点编号为i的租赁点还车的记录有M条,表示租赁点i有M个WDi=(i,s,t)这样的单词。步骤3所述的使用LDA算法和K-means算法对租赁点进行租赁点功能识别具体如下:3-1.根据步骤2得出的每篇“文档”的“单词”,对公共自行车系统租赁点使用LDA算法并得到每个租赁点的主题分布,将得到文档在每一主题上的概率分布作为文档的特征值;所述对公共自行车系统租赁点使用LDA算法从而得到每个租赁点的主题分布的过程如下:3-1-1.对于所有的主题k∈[1,K]:生成3-1-2.对于所有的文档s∈[1,S]:生成文档-主题分布生成文档的长度Ns,Ns~Poiss(ξ);3-1-3.对于任意一篇文档的单词n∈[1,Ns]:生成单词所对应的主题生成该主题对应的单词其中S为公共自行车系统租赁点的总数;K为设置的租赁点功能数(主题);Ns为编号为s的租赁点中单词的总数;代表第s个租赁点的主题分布;Zs,n生成编号为s的租赁点的第n个单词的租赁点功能;代表编号为k的主题之上的词分布;代表每个租赁点的主题分布的先验分布Dirichlet分布的参数;代表每个主题的词分布的先验分布Dirichlet分布的参数;为通过租赁点的使用模式转化租赁点所具有的单词。所述的将得到文档在每一主题上的概率分布作为文档的特征值,具体的使用吉布斯采样来估计LDA分布,从而求出以下矩阵作为文档的特征值:每个租赁点的各个词被指定的主题编号:.tassign;每个租赁点的主题概率分布Θ:.theta;每个主题下的词概率本文档来自技高网
...
一种公共自行车系统租赁点功能聚类方法

【技术保护点】
一种公共自行车系统租赁点功能聚类方法,其特征在于包含以下步骤:步骤1、对于公共自行车系统,首先利用租赁点位置信息,采用泰森多边形算法对城市进行区域划分,每个租赁点覆盖一定的区域,将每个租赁点看做一个“文本”进行挖掘分析;步骤2、将公共自行车系统的使用历史记录转换为该租赁点所包含的“单词”;步骤3、使用LDA模型和K‑means算法对租赁点进行租赁点功能识别;步骤4、对每个聚类结果进行时空特征分析,定义每种聚类包含的那些租赁点所代表的功能。

【技术特征摘要】
1.一种公共自行车系统租赁点功能聚类方法,其特征在于包含以下步骤:步骤1、对于公共自行车系统,首先利用租赁点位置信息,采用泰森多边形算法对城市进行区域划分,每个租赁点覆盖一定的区域,将每个租赁点看做一个“文本”进行挖掘分析;步骤2、将公共自行车系统的使用历史记录转换为该租赁点所包含的“单词”;步骤3、使用LDA模型和K-means算法对租赁点进行租赁点功能识别;步骤4、对每个聚类结果进行时空特征分析,定义每种聚类包含的那些租赁点所代表的功能。2.根据权利要求1所述的一种公共自行车系统租赁点功能聚类方法,其特征在于步骤2所述的将公共自行车系统的使用历史记录转换为该租赁点所包含的“单词”,具体操作如下:2-1.定义每个乘客的一次出行产生的记录为TS,TS=(TS.SO,TS.tO,TS.SD,TS.tD),其中,TS.SO表示借车站点,TS.SD表示还车站点,TS.tO表示借车时刻,TS.tD表示还车时刻;2-2.由于用户能够在任意租赁点租借/归还自行车,因此设置两种客流模式:租借模式、归还模式;定义MO为租借模式:MO=(TS.SO,TS.SD,TS.tO);定义MD为归还模式:MD=(TS.SO,TS.SD,TS.tD);2-3.对每个租赁点设置两种使用模式,分别为租借模式和归还模式,分别定义为XSO、XSD;根据用户的客流模式得出所有租赁点s(1…S)的使用模式向量:XSO=(CO1,CO2,…,COs,…,COS);XSD=(CD1,CD2,…,CDs,…,CDS);其中,COs为在编号为s的租赁点发生租借行为的所有记录,COs=‖{MO={x,y,z}|x=s,y=i,z=k‖,COs它是一个S×T矩阵,表示在时间点(1…k··T)内,从编号为s的租赁点借车,到编号为(1··i··S)的租赁点还车发生的记录统计量;同理,CDs为在编号为s的租赁点发生还车行为的所有记录,CDs=‖{MD={x,y,z}|x=i,y=s,z=k‖,它是一个S×T矩阵,表示在时间点(1…k··T)内,从编号为(1··i··S)的租赁点借车,到编号为s的租赁点还车发生的记录统计量;2-4.将每一个租赁点作为一个文档,租赁点对应的区域功能视作文档的主题,租赁点的使用模式相当于组成每篇文档的单词;公共自行车系统一共有S个租赁点,设研究的文档个数也为S篇;根据租赁点的使用模式向量XSO和XSD,得出任意一个租赁点的组成内容为Cs=(WOs,WDs);以编号为i的租赁点为例来说明一篇文档的单词是如何计算的,编号为i的租赁点的定义单词为WOi=COi,WDi=CDi;在时刻t时,从编号为i的租赁点借车去到租赁点编号为s(1,2,…,..,S)的租赁点还车的记录有M条,表示租赁点i有M个WOi=(i,s,t)这样的单词;在时刻t时,从编号为s(1,2,…,..,S)的租赁点借车去到租赁点编号为i的租赁点还车的记录有M条,表示租赁点i有M个WDi=(i,s,t)这样的单词。3.根据权利要求1所述的一种公共自行车系统租赁点功能聚类方法,其特征在于步骤3所述的使用LDA算法和K-means算法对租赁点进行租赁点功能识别具体如下:3-1.根据步骤2得出的每篇“文档”的“单词”,对公共自行车系统租赁点使用LDA算法并得到每个租赁点的主题分布,将得到文档在每一主题上的概率分布作为文档的特征值;所述对公共自行车系统租赁点使用LDA算法从而得到每个租赁点的主题分布的过程如下:3-1-1.对于所有的主题k∈[1,K]:生成3-1-2.对于所有的文档s∈[1,S]:生成文档-主题分布生成文档的长度NS,Ns~Poiss(ξ);3-1-3.对于任意一篇文档的单词n∈[1,Ns]:生成单词所对应的主题生成该主题对应的单词其中S为公共自行车系统租赁点的总数;K为设置的...

【专利技术属性】
技术研发人员:王兰迪申兴发姚霞文
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1