耦合街区时空特征和集成学习的城市功能区精细化识别方法技术

技术编号:36072475 阅读:12 留言:0更新日期:2022-12-24 10:42
本发明专利技术公开了耦合街区时空特征和集成学习的城市功能区精细化识别方法,即:首先,利用OSM路网生成街区,作为城市功能区的基本单元;然后,使用建筑物轮廓、POI、腾讯位置数据和谷歌影像等多源时空大数据,构建由“形状

【技术实现步骤摘要】
耦合街区时空特征和集成学习的城市功能区精细化识别方法


[0001]本专利技术属于地理信息时空大数据领域,特别是耦合街区时空特征和集成学习的城市功能区精细化识别方法。

技术介绍

[0002]随着城市化的快速发展,城市土地利用的类型变得更加的复杂多样。精细化的城市土地利用信息为掌握城市结构和辅助政府决策提供了重要的数据支撑。传统的土地利用信息的收集方法主要由政府机构主导,进行实地走访和问卷调查,耗时、耗力而且公众开放程度较低。
[0003]现有的城市土地利用分类方法,主要以遥感影像作为数据源,利用地物的光谱、纹理等信息进行用地类型的划分,对森林、湖泊、海洋等光谱特征突出的自然类别有较好的识别效果,但是难以进一步区分建成区内的功能用途,无法满足城市用地的精细化识别需求。众源地理信息的出现,引入蕴含人类活动和社会经济特征的海量数据,极大的丰富了城市土地利用识别的数据来源。Point of interest(POI)是一种典型的众源地理数据,具有丰富的属性信息,适用于城市功能区制图。姚尧等以珠江三角洲为研究区,使用POI识别了城市功能区类别;窦旺胜等基于POI实现了济南市五区内用地功能的识别和可视化;Silva等则利用POI绘制了伦敦城市功能区分布图。随着众源地理信息的发展,更多带有时间属性,包含用户位置的数据如GPS轨迹、腾讯位置数据进入大众视野。将遥感影像和众源地理信息结合已经成为表征城市功能区的新趋势。胡忠文等通过整合遥感影像和手机定位数据提取城市景观和人类活动信息,聚类生成了深圳市的功能区类别。邱国平等基于深度学习方法,融合遥感影像和社会感知数据,揭示了研究区城市功能区类型。钟燕飞等使用POI、OSM路网和遥感影像构建点

线

面语义对象制图框架,实现了北京、武汉中心区域、武汉汉阳区、武汉汉南区、澳门和香港湾仔区共计6个区域的城市功能区制图。
[0004]以上研究表明,遥感和众源数据在土地信息提取方面都有其独特优势,融合多源时空大数据是识别城市功能区的一种新趋势。然而,现有相关研究缺乏对城市功能区特征的深入探究和全面挖掘。例如,建筑物作为城市功能的基本单元,其几何特征在一定程度上可以反映城市功能区的详细信息;人口分布的动态变化折射出城市用地的职

住格局,挖掘人类活动在不同时间段下的变化特征,在解析城市功能结构上可以发挥巨大潜力。
[0005]融合多源时空大数据提取的城市功能区特征,难免会产生数据维数高、信息冗余等问题。进行有效的特征降维处理,对揭示隐含的核心特征和提高城市功能区识别效率具有积极作用。主成分分析作为经典的数据降维方法,已经广泛应用于各类数据分析问题中。这种方法在处理线性关系强、类别间样本数量均衡的特征数据时,效果较好。然而,城市功能区特征来自不同的数据源,特征间存在复杂的非线性关系,在处理这种高维度且线性关系弱的数据时,有必要利用神经网络模型学习复杂数据结构并提取核心特征。
[0006]构建智能化的分类模型是城市功能区识别的另一个核心问题。现有的功能区分类方法主要包含非监督分类和监督分类两种。其中,K均值、模糊c均值和自组织映射网络
(SOM)是城市功能区划分常用的非监督分类方法。许珺等使用K均值方法,将城市功能区聚成了5类,进而使用POI标签去推断聚类簇的类别。裴韬等使用模糊c均值将新加坡划分为居住区、商务区、商业区、开放空间和其他5种类型。王红等则使用SOM将功能区聚合为居住、商业、商业/社会、购物商场/居住区等9类。由以上研究可知,非监督分类方法在聚类数量上存在较大的不确定性,同时,由于没有预先设定分类体系,导致分类结果与国家标准(如GB/T 21010

2017,GB50137

2011)存在差异,不利于为城市规划服务。相比之下,监督分类可以建立特征和城市预设类别之间的关系模型,应用更为广泛。宫鹏等使用随机森林方法,按照中国土地利用标准(GB/T 21010

2017)对中国重要城市进行功能区识别。明冬萍等使用卷积神经网络按照城乡土地利用分类和开发用地规划标准揭示了杭州主要区域的功能区类别。然而,利用单一的机器学习方法进行城市功能区识别,在模型泛化能力和分类精度方面存在明显局限性,由多个弱分类器组合而成的集成学习方法能够很好的弥补单一学习器的不足。
[0007]本专利技术提出了耦合街区时空特征和集成学习的城市功能区精细化识别方法,该方法以街区作为城市功能区的基本单元,进一步加强了遥感影像和众源地理信息的结合,提出SALT街区时空特征体系,更加全面深入的提取了城市功能区的特征;引入深度学习自编码器Autoencoder模型消除SALT特征冗余,相较于经典的主成分分析模型,该模型能处理复杂的非线性结构且在挖掘城市功能区的核心语义信息时更有效;构建基于Adaboost集成学习的城市功能区分类模型,不仅能提高模型的泛化能力,也有利于提高功能区分类的精度。综上,该方法从多源时空大数据特征提取、城市功能区核心语义挖掘到机器学习模型的集成应用,保障了识别效果的鲁棒性和准确性,大幅度提升了城市功能区的分类精度。

技术实现思路

[0008]本专利技术需要解决的技术问题是:针对面向城市功能区精细化分类需求,提出了耦合街区时空特征和集成学习的城市功能区精细化识别方法。该方法以街区作为城市功能区的基本单元,从建筑物形状、POI标签属性、手机用户位置和高分辨率谷歌影像纹理四方面深入挖掘多源时空大数据的信息,构建了SALT街区时空特征体系,引入深度学习自编码器Autoencoder模型消除SALT特征冗余,使用Adaboost集成学习对城市功能区分类。从多源时空大数据特征提取、城市功能区核心语义挖掘到机器学习模型的集成应用,保障了识别效果的鲁棒性和准确性,大幅度提升了城市功能区的分类精度。
[0009]本专利技术解决其技术问题采用以下的技术方案:
[0010]本专利技术提供的耦合街区时空特征和集成学习的城市功能区精细化识别方法,具体是:首先,对OSM路网进行预处理,生成研究区内街区划分结果,即为城市功能区的基本单元;然后,提取各街区单元的纹理和语义特征,其包括利用建筑物轮廓、POI、位置数据和高分辨率影像多源时空大数据,构建由“形状

属性

位置

纹理”组成的SALT街区时空特征体系;接着,使用深度学习自编码器Autoencoder,对SALT特征进行降维,以消除特征间的信息冗余;最后,使用降维后的SALT特征和功能区标签训练Adaboost集成学习模型,将训练好的模型用于城市功能区分类,识别出各街区的精细化功能类别。
[0011]本专利技术可以使用以下方法生成城市功能区的基本单元,简称街区单元:对OSM路网依次进行投影变换、缓冲区分析、中心线提取、要素转面和消除处理,再以高分辨率谷歌影
像为底图,对生成的面要素进行核查,使其与底图完全匹配,得到街区单元。
[0012]本专利技术可以使用以下方法,构建SALT本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.耦合街区时空特征和集成学习的城市功能区精细化识别方法,其特征在于:首先,对OSM路网进行预处理,生成研究区内街区划分结果,即为城市功能区的基本单元;然后,提取各街区单元的纹理和语义特征,其包括利用建筑物轮廓、POI、位置数据和高分辨率影像多源时空大数据,构建由“形状

属性

位置

纹理”组成的SALT街区时空特征体系;接着,使用深度学习自编码器Autoencoder,对SALT特征进行降维,以消除特征间的信息冗余;最后,使用降维后的SALT特征和功能区标签训练Adaboost集成学习模型,将训练好的模型用于城市功能区分类,识别出各街区的精细化功能类别。2.根据权利要求1所述的耦合街区时空特征和集成学习的城市功能区精细化识别方法,其特征在于,使用以下方法生成城市功能区的基本单元,简称街区单元:对OSM路网依次进行投影变换、缓冲区分析、中心线提取、要素转面和消除处理,再以高分辨率谷歌影像为底图,对生成的面要素进行核查,使其与底图完全匹配,得到街区单元。3.根据权利要求1所述的耦合街区时空特征和集成学习的城市功能区精细化识别方法,其特征在于,使用以下方法,构建SALT街区时空特征体系:对于形状特征,从公开平台获取天地图影像,使用基于阈值的影像分割算法提取研究区建筑物,计算建筑物形状特征指标,并统计得到每个街区内建筑物形状特征指标的均值、标准差和总和值;对于属性特征,将POI数据按其标签分类,再对各类别POI进行核密度分析,统计各街区各类POI核密度的均值,以及核密度最大值所对应的POI类别;对于位置特征,根据时间字段,将手机用户腾讯位置数据分割为节假日、工作日和双休日三种时间属性,统计每个街区内各时间属性下人数总和、每小时人数平均值及单位面积人数值,同时创建不同时间类型下时空立方体,进行新兴时空热点分析,统计时空热点的众数,得到每个街区工作日、节假日、双休日的时空模式;对于纹理特征,构建遥感影像第一主成分波段的灰度共生矩阵,提取影像的纹理特征,统计每个街区内纹理特征的平均值。4.根据权利要求3所述的耦合街区时空特征和集成学习的城市功能区精细化识别方法,其特征在于,使用基于阈值的影像分割算法提取了研究区建筑物,计算了每个街区单元的建筑物形状特征,其过程包括:(1)从开放平台获取18级天地图RGB影像,采用按掩膜提取、投影栅格和波段提取得到研究区内天地图单波段影像;(2)通过灰度直方图确定提取建筑物的灰度阈值,如果像素的灰度值在阈值范围内,则值被设置为1,即为建筑物,否则值被设置为0;(3)采用众数滤波将灰度值小于阈值的像元移除,随后使用栅格转面将建筑物转为矢量格式,再对矢量建筑物进行消除面部分和简化建筑物处理;(4)将处理后的建筑物与高分辨率谷歌影像叠加,核查提取建筑物的完整性和准确性;(5)计算建筑物的形状特征,提取每个建筑物的面积、周长、圆形度、节点数、矩形度、长宽比、半径形状指数和方向,进而使用空间连接统计每个街区各形状指数的总和值、平均值和标准差。5.根据权利要求3所述的耦合街区时空特征和集成学习的城市功能区精细化识别方法,其特征在于,使用核密度估计方法提取了研究区内各类POI的属性特征,其过程包括:(1)根据POI的标签,将其分为14个类别:“政府机构及社会团体、医疗服务、体育休闲服务、生活服务、商务住宅、汽车服务、科教文化服务、居民住宅、金融保险服务、交通设施服
务、购物服务、公园绿地、公司企业和餐饮服务”;(2)使用核密度估计方法,将研究区内POI点数据转换为连续的表面,以得到14类POI的密度分布,并使用区域统计至表得到各街区各类POI核密度的均值;其中,核密度计算公式如下:式中,F(x)是位置x处的密度估计函数;d是空间维度;h代表带宽;N是与位置x的距离小于h的点数;K是空间权重函数;(3)将属性表导出至excel表,根据excel的数据透视和公式计算功能,得到各街区核密度最大值所对应的POI类别。6.根据权利要求3所述的耦合街区时空特征和集成学习的城市功能区精细化识别方法,其特征在于,使用新兴时空热点分析方法提取了手机用户在节假日、工作日、双休日的位置特征,其过程包括:(1)通过腾讯宜出行平台提供的API接口收集到2018.06.18

2018.06.24,7:00

21:00,时间分辨率为1小时,空间分辨率为1.5千米的腾讯位置数据,并采用Python语言,对数...

【专利技术属性】
技术研发人员:林安琪吴浩罗文庭江志猛李岩
申请(专利权)人:华中师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1