一种基于位置数据和聚类算法的公共服务设施分级方法技术

技术编号:23446737 阅读:34 留言:0更新日期:2020-02-28 20:41
本发明专利技术提供了一种基于位置数据和聚类算法的公共服务设施分级方法。本发明专利技术包含设施核心辐射区面积、总辐射区面积、到访者人均出行距离、到访设施的总人数、设施面积五个维度的指标,前三个指标从不同角度衡量了公共服务设施辐射范围的大小,后两个指标则从客流和设施资源的角度衡量了公共服务设施服务规模的大小。根据实际经验,设施辐射范围越大、客流量越大、人均出行距离越长、设施占地面积越大,则其等级越高。因此基于上述五个维度指标均值之和,可以描述聚类所形成的三簇样本的主要特征,以及簇之间的核心区别,使聚类结果最终和城市公共服务设施等级相对应。

A classification method of public service facilities based on location data and clustering algorithm

【技术实现步骤摘要】
一种基于位置数据和聚类算法的公共服务设施分级方法
本专利技术涉及城市公共服务设施能级评定,具体来说,本专利技术涉及一种基于位置数据和K均值聚类算法的公共服务设施等级评定方法。
技术介绍
城市公共服务中心体系规划在城市公共服务设施供给侧优化和提升中发挥重要作用,层级明确、分工合理的公共服务中心可以促进公共服务资源可有效兼顾效率和公平,增强城市活力,提升居民幸福感。公共服务中心体系是指在一个城市中,由不同等级规模、不同职能类型、不同服务范围的公共服务设施集合构成,联系密切、相互依存的有机整体。一般情况下可划分为市级、片区级及居住区级公共服务中心。而作为公共服务中心的组成要素,各类公共服务设施也需要进行相应的等级规模、职能类型、服务范围的划分。传统的公共服务设施等级划分一般从资源规划的角度出发,通过设施面积等规模指标作为评定标准,划定结果反映的是规划目标,而非实设施际运营水平。而在新数据条件下,采用设施使用者位置数据,可以量化公共服务设施的真实服务范围和真实服务人群的规模。在原设施面积规模指标的基础上,加入设施客流来源地覆盖面积、客流人均OD距离等反映设施辐射范围的指标,以及从设施使用者角度出发反映设施规模的总客流量指标,可对公共服务设施实际服务能力的等级进行划定。所得结果与设施规划的目标等级进行对比,还可进一步评估公共服务设施规划的实施效果。
技术实现思路
本专利技术目的是:通过采用设施使用者位置数据,设计一套公共服务设施的真实服务范围和真实服务规模的量化体系,在此基础上通过K均值聚类算法,实现对公共服务设施等级更客观有效的评估和划定。为了达到上述目的,本专利技术的技术方案是提供了一种基于位置数据和聚类算法的公共服务设施分级方法,其特征在于,包括以下步骤:步骤1、将到访公共服务设施的设施使用者的位置数据导入数据库,在数据库中统计一日之内到访公共服务设施的OD出行数据,包括以下步骤:步骤101、将位置数据导入数据库,从而获得各设施使用者的出行起点的经纬度坐标、出行起点编号、出行终点的纬度坐标、出行终点编号、出行终点所对应的公共服务设施编号、一日之内从各出行起点达到各出行终点的出行人数,将一日之内从出行起点i达到出行终点j的出行人数定义为pij;步骤102、计算得到各出行起点与各出行终点之间的出行距离,将从出行起点i到达出行终点j的出行距离定义为qij,则有:式中,(xOi,yOi)为出行起点i的经纬度坐标,(xDi,yDi)为出行终点j的经纬度坐标;步骤2、对每个公共服务设施,计算其客流来源地的覆盖面积,计算公共服务设施Sk的客流来源地的覆盖面积包括以下步骤:步骤201、从步骤1所获得的OD出行数据中筛选出具有相同出行起点和公共服务设施编号的数据组成OD出行数据子集,该公共服务设施编号为公共服务设施Sk的编号,获得OD出行数据子集中从相同出行起点达到公共服务设施Sk的总出行人数,将从出行起点i达到公共服务设施Sk的总出行人数定义为Pik;步骤202、将公共服务设施Sk的所有的出行起点的经纬度坐标及相对应的总出行人数输入GIS,基于GIS的核密度算法生成公共服务设施Sk到访者来源地的核密度栅格;步骤203、将核密度栅格转为面要素类,面要素类含表示每个面要素的密度值的字段gridcode,并对面要素类新增字段pct和字段Accu,字段pct表示密度值占比,由每个面要素的字段gridcode值除以所有面要素的该字段总和得到,字段Accu表示字段pct的累计值;步骤204、将公共服务设施Sk每个面要素按照面要素内的到访者人数从高到低排序后,对所有面要素进行遍历,并对字段pct进行累加,赋予字段Accu,将字段Accu≤50%的面要素组成的区域划定为设施核心辐射区,剩余区域划定为边缘辐射区;2.5、统计各设施核心辐射区面积Ck及总辐射区面积Tk;步骤3、计算到访每个公共服务设施的到访者总人数,将到访公共服务设施Sk的到访者总人数定义为Pk,则有:式中,n表示出行终点对应公共服务设施Sk的所有出行起点的总个数;步骤4、计算每个公共服务设施的到访者人均出行距离,将公共服务设施Sk的到访者人均出行距离定义为Qk,则有:式中,{j}表示设施Sk范围中所有的出行终点的集合,{i}表示出行终点为j点的所有出行的出行起点集合;步骤5、计算各公共服务设施的占地面积,公共服务设施Sk的占地面积定义为Mk;步骤6、将各个公共服务设施的核心辐射区面积、总辐射区面积、到访者人均出行距离、到访者总人数、设施面积分别进行归一化处理,并整理为csv格式的表table;步骤7、利用K均值聚类算法,以表table中的核心辐射区面积、总辐射区面积、到访者人均出行距离、到访者总人数、设施面积作为5维向量,对所有公共服务设施进行聚类,统计公共服务设施的核心辐射区面积、总辐射区面积、到访者人均出行距离、到访者总人数、设施面积的指标均值之和,将均值之和最大的类别评定为城市级设施,均值之和最小的类别评定为居住区级设施,处于中间的类别则评定为片区级设施。优选地,步骤6中,对于公共服务设施Sk的核心辐射区面积Ck、总辐射区面积Tk、到访者人均出行距离Qk、到访者总人数Pk、设施面积Mk进行归一化处理的公式为:Ck'=(Ck-Cmin)/(Cmax-Cmin)Tk'=(Tk-Tmin)/(Tmax-Tmin)Qk'=(Qk-Qmin)/(Qmax-Qmin)Pk'=(Pk-Pmin)/(Pmax-Pmin)Mk'=(Mk-Mmin)/(Mmax-Mmin)Cmax、Tmax、Qmax、Pmax及Mmax分别为所有公共服务设施中核心辐射区面积、总辐射区面积、到访者人均出行距离、到访者总人数及设施面积的最大值;Cmin、Tmin、Qmin、Pmin、Mmin分别为所有公共服务设施中核心辐射区面积、总辐射区面积、到访者人均出行距离、到访者总人数及设施面积的最小值;Ck'、Tk'、Qk'、Pk'、Mk'分别为归一化后的公共服务设施Sk的核心辐射区面积、总辐射区面积、到访者人均出行距离、到访者总人数、设施面积。优选地,所述步骤7包括以下步骤:步骤701、使用Python的pandas库将步骤6得到的表table读取为pandas中的DataFrame,命名为df;步骤702、基于Python的sklearn库cluster下的KMeans算法包,实例化一个n_clusters为3以及其他参数保持缺省的模型对象model;步骤703、使用model.fit(df)对步骤701所述DataFrame进行聚类,结果赋值给变量model_labels;步骤704、将model_labels与步骤701中的df拼接,最终得到设施的分类属性列cluster,该列包含0、1、2三个值,分别代表某一级别设施;步骤705、统计公共服务设施的核心辐射区面积、总辐射区面积、到本文档来自技高网...

【技术保护点】
1.一种基于位置数据和聚类算法的公共服务设施分级方法,其特征在于,包括以下步骤:/n步骤1、将到访公共服务设施的设施使用者的位置数据导入数据库,在数据库中统计一日之内到访公共服务设施的OD出行数据,包括以下步骤:/n步骤101、将位置数据导入数据库,从而获得各设施使用者的出行起点的经纬度坐标、出行起点编号、出行终点的纬度坐标、出行终点编号、出行终点所对应的公共服务设施编号、一日之内从各出行起点达到各出行终点的出行人数,将一日之内从出行起点i达到出行终点j的出行人数定义为pij;/n步骤102、计算得到各出行起点与各出行终点之间的出行距离,将从出行起点i到达出行终点j的出行距离定义为qij,则有:/n

【技术特征摘要】
1.一种基于位置数据和聚类算法的公共服务设施分级方法,其特征在于,包括以下步骤:
步骤1、将到访公共服务设施的设施使用者的位置数据导入数据库,在数据库中统计一日之内到访公共服务设施的OD出行数据,包括以下步骤:
步骤101、将位置数据导入数据库,从而获得各设施使用者的出行起点的经纬度坐标、出行起点编号、出行终点的纬度坐标、出行终点编号、出行终点所对应的公共服务设施编号、一日之内从各出行起点达到各出行终点的出行人数,将一日之内从出行起点i达到出行终点j的出行人数定义为pij;
步骤102、计算得到各出行起点与各出行终点之间的出行距离,将从出行起点i到达出行终点j的出行距离定义为qij,则有:



式中,(xOi,yOi)为出行起点i的经纬度坐标,(xDi,yDi)为出行终点j的经纬度坐标,R为地球平均半径;
步骤2、对每个公共服务设施,计算其客流来源地的覆盖面积,计算公共服务设施Sk的客流来源地的覆盖面积包括以下步骤:
步骤201、从步骤1所获得的OD出行数据中筛选出具有相同出行起点和公共服务设施编号的数据组成OD出行数据子集,该公共服务设施编号为公共服务设施Sk的编号,获得OD出行数据子集中从相同出行起点达到公共服务设施Sk的总出行人数,将从出行起点i达到公共服务设施Sk的总出行人数定义为Pik;
步骤202、将公共服务设施Sk的所有的出行起点的经纬度坐标及相对应的总出行人数输入GIS,基于GIS的核密度算法生成公共服务设施Sk到访者来源地的核密度栅格;
步骤203、将核密度栅格转为面要素类,面要素类含表示每个面要素的密度值的字段gridcode,并对面要素类新增字段pct和字段Accu,字段pct表示密度值占比,由每个面要素的字段gridcode值除以所有面要素的该字段总和得到,字段Accu表示字段pct的累计值;
步骤204、将公共服务设施Sk每个面要素按照面要素内的到访者人数从高到低排序后,对所有面要素进行遍历,并对字段pct进行累加,赋予字段Accu,将字段Accu≤50%的面要素组成的区域划定为设施核心辐射区,剩余区域划定为边缘辐射区;
2.5、统计各设施核心辐射区面积Ck及总辐射区面积Tk;
步骤3、计算到访每个公共服务设施的到访者总人数,将到访公共服务设施Sk的到访者总人数定义为Pk,则有:



式中,n表示出行终点对应公共服务设施Sk的所有出行起点的总个数;
步骤4、计算每个公共服务设施的到访者人均出行距离,将公共服务设施Sk的到访者人均出行距离定义为Qk,则有:



式中,{j}表示设施Sk范围中所有的出行终点的集合,{i}表示出行终点为j点的所有出行的出行起点集合;
步骤5、计算各公共服务设施的占地面积,公共服务设施Sk的占地面积定义为Mk;
步骤6、将各个公共服务设...

【专利技术属性】
技术研发人员:裘炜毅罗力宇李明敏
申请(专利权)人:上海元卓信息科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1