城市空间高质量利用测定方法、系统、计算机设备及终端技术方案

技术编号:34321169 阅读:18 留言:0更新日期:2022-07-31 00:13
本发明专利技术属于国土空间规划信息处理技术领域,提供了一种城市空间高质量利用测定方法、系统、计算机设备及终端,通过城市空间数据、经济社会数据、城市运行数据及人群行为数据等多源空间数据融合并形成数据集;构建系统的城市空间(三类)高质量评价体系,基于机器学习模型对评价模型进行智能化训练,进而对城市空间进行自动化高质量测定。本发明专利技术基于机器学习的城市空间高质量利用测度方法,将机器学习算法与城市空间高质量发展评价相结合,充分发挥机器学习的自我学习优势,解决当前城市空间高质量发展特征识别精细化、问题查找精细化及治理决策精准化的问题,为高质量城市建设及高水平城市空间治理提供智能化的理论方法、智能技术与系统支撑。系统支撑。系统支撑。

【技术实现步骤摘要】
城市空间高质量利用测定方法、系统、计算机设备及终端


[0001]本专利技术属于国土空间规划信息处理
,尤其涉及一种城市空间高质量利用测定方法、系统、计算机设备及终端。

技术介绍

[0002]目前,伴随着社会经济高速发展的城市人口增多、城镇化转型、城市土地资源错置、生态环境遭到破坏,新时期城市空间如何高质量发展成为现阶段我们要探讨解决的问题。首先,新时代国土空间规划体系的建立,表明中国国土空间的利用呈现出向集约化、绿色化、人本化、智慧化方向的转变,国土空间高质量利用评价作为国土空间规划治理的重要基础与支撑具有重大现实意义;其次,新时期城市需系统地解决“实现人的全面发展”的生产、生活及生态空间需求,并将居民行为研究与空间供需结合起来是亟需突破的问题;最后,伴随着智慧社会的崛起和大数据与人工智能等新技术的快速发展,将智能技术和智慧思维运用于提升资源的利用效率、优化空间规划治理是当前行业发展重要趋势。本专利技术基于新时代发展背景,结合当前的规划需求与技术发展的支撑,重点研究多源数据支撑的城市空间高质量利用评价思路,并搭建基于机器学习的城市空间高质量利用测度方法与应用框架对于精细识别空间高质量利用特征、精确定位空间高质量利用问题、精准突破空间高质量利用瓶颈有着重要意义,对新时期高质量发展与高水平治理极为重要。
[0003]大数据相较于传统数据具有海量性、持续性等特点,相较于传统数据在描述人地关系和发现空间问题上具有一定优势,数据更加全面、科学、客观,在城市空间质量评价中已有一些实践,应用于城镇体系与区域联系、城市空间结构与功能分区、公共服务设施布局等方面,但当前对整合多源数据,建立数据集,通过机器学习进行国土空间高质量利用评价的方法思路研究较少。
[0004]现有技术存在的问题及缺陷为:
[0005](1)数据收集与融合的问题。当前对整合大数据,建立数据集,由于识别三生空间利用情况所需的数据繁多冗杂,导致数据收集及整理提取方法效率低,耗费时间长,且各类数据之间标准不一、维度不同,导致数据融合难度角度,空间问题识别过程繁多、效率低,且一些权重确定方法如特尔菲方法、AHP软件分析存在精度较低、客观性不足等问题。
[0006](2)评价方法的科学性与智能化程度较低。一方面,目前主流的评价方法主要基于传统空间分析方法,过程中模型的自我调节能力较差,且分析过程容易受人为因素干扰,影响了结果的客观性、科学性和精准性;另一方面,当前通过机器学习进行国土空间高质量利用评价的方法思路研究较少,本专利技术可为行业创新提供一种新的方法。

技术实现思路

[0007]针对现有技术存在的问题,本专利技术的目的是提供一种城市空间高质量利用测定方法、系统、计算机设备及终端,尤其涉及一种基于机器学习的城市空间高质量利用测定方法、系统、计算机设备及终端。
[0008]本专利技术是这样实现的,一种城市空间高质量利用智能化测定方法,所述城市空间高质量利用测定方法包括:
[0009]在城市空间数据、经济社会数据、城市运行数据及人群行为数据的多源异构数据基础上,利用面向语义的元数据模型,构建基于多源数据的城市空间高质量评价数据集;构建系统的城市空间高质量评价标准及模型,并通过机器学习对模型进行不断训练强化模型适应性;利用机器学习技术,进行城市空间高质量自动化分析,并提供智能化可视化结果及辅助决策。
[0010]进一步,所述城市空间高质量利用测定方法包括以下步骤:
[0011]步骤一,多源异构融合数据集:进行城市空间高质量评价数据集的构建及数据预处理;
[0012]步骤二,评估模型训练:利用机器学习训练城市空间高质量量化模型;
[0013]步骤三,智能化评价:利用融合分析技术进行城市空间高质量利用分析。
[0014]进一步,所述步骤一中的多源异构融合数据集的构建包括:
[0015]构建基于深度学习的多源异构数据融合方法,实现多源异构数据间的融合;基于“特征变换

非线性操作

特征选择”的多层迭代模型,基于地理信息系统的栅格数据模型与矢量数据模型,实现文本数据、矢量数据与影像数据的融合。
[0016]进一步,所述步骤二中,利用机器学习方法进行评价模型训练包括:
[0017](1)因子选取:根据测定目标设定及已有标准、规范、研究成果及需要选取评价因子,并构建评价指标体系;
[0018](2)自助采样:利用自助采样法对原始数据集进行随机采样,从总训练样本D中用Bootstrap采样选取k个子训练样本集D1,D2,...,D
k
,并预建k棵分类树;
[0019](3)决策树生成:针对K个训练数据集,随机选择划分属性集合,递归节点划分,训练形成K棵不同基决策树;
[0020]1)利用Bagging方法获取训练集:从具有N个样本的总训练集中有放回地随机抽取n个组成单棵树的训练集,所述训练集是输入训练集S1;
[0021]2)随机选取节点效用指标:设RF模型共有M个效用指标,指定正整数m(m<<M)),Breiman推荐m取M的平方根;随机从M个指标中选取m个作为节点指标;
[0022]3)节点递归分割:对于每一节点效用指标都要遍历所有可能的分割方法,选择最小的基尼值Gini作为此节点的分割标准,对应的效用指标为最优分割效用指标,按最优分割效用指标进行分割;对于节点2,数据集S2被最优效用分割指标的一阈值t2分为两个子数据集1和S3;其中子集1节点的基尼指数Gini通过设定阈值判断,认为所有样板所属同一类别,所述类别为效用级别1,不用继续分割,而数据集S3则继续分割;节点基尼指数用于描述节点的不纯度,计算见下式:
[0023][0024]式中,p(j|t)为效用等级j在t节点处的概率,Gini(t)为0时,表示在t节点处的样本数据为同一效用级别;Gini(t)越大,表明在t节点处的样本数据越趋于平均分布,能获得有用信息越小;
[0025]4)任意生长,不进行剪枝;
[0026](4)模型泛化误差与效用指标重要性计算
[0027]RF采用Bagging算法集成训练集,样本容量为N的总训练集D中每个样本未被抽取的概率为(1

1/N)
N
,当N足够大时,表明D中1/3的样本不会出现在Bootstrap采样子集中,数据成为袋外OOB数据;在效用分类树生成后,利用OOB数据得出该棵树的错误分类率,所述错误分类率是OOB误差;对森林中所有树的OOB误差取平均作为模型的泛化误差;
[0028]RF对效用指标的重要性进行计算的方法包括以下两种:
[0029]1)对每棵树,计算OOB误差E
OOB1
,对效用指标i的数据加入噪声并计算OOB误差E
OOB2
;将E
OOB1
与E
OOB2
的差对所有树取平均,并用标准差归一化,得到效用指标i的重要性;
[0030]2)计算本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种城市空间高质量利用智能化测定方法,其特征在于,所述城市空间高质量利用测定方法包括:在城市空间数据、经济社会数据、城市运行数据及人群行为数据的多源异构数据基础上,利用面向语义的元数据模型,构建基于多源数据的城市空间高质量评价数据集;构建系统的城市空间高质量评价标准及模型,并通过机器学习对模型进行不断训练强化模型适应性;利用机器学习技术,进行城市空间高质量自动化分析,并提供智能化可视化结果及辅助决策。2.如权利要求1所述的城市空间高质量利用测定方法,其特征在于,所述城市空间高质量利用测定方法包括以下步骤:步骤一,多源异构融合数据集:进行城市空间高质量评价数据集的构建及数据预处理;步骤二,评估模型训练:利用机器学习训练城市空间高质量量化模型;步骤三,智能化评价:利用融合分析技术进行城市空间高质量利用分析。3.如权利要求2所述的城市空间高质量利用测定方法,其特征在于,所述步骤一中的多源异构融合数据集的构建包括:构建基于深度学习的多源异构数据融合方法,实现多源异构数据间的融合;基于“特征变换

非线性操作

特征选择”的多层迭代模型,基于地理信息系统的栅格数据模型与矢量数据模型,实现文本数据、矢量数据与影像数据的融合。4.如权利要求2所述的城市空间高质量利用测定方法,其特征在于,所述步骤二中,利用机器学习方法进行评价模型训练包括:(1)因子选取:根据测定目标设定及已有标准、规范、研究成果及需要选取评价因子,并构建评价指标体系;(2)自助采样:利用自助采样法对原始数据集进行随机采样,从总训练样本D中用Bootstrap采样选取k个子训练样本集D1,D2,

,D
k
,并预建k棵分类树;(3)决策树生成:针对K个训练数据集,随机选择划分属性集合,递归节点划分,训练形成K棵不同基决策树;1)利用Bagging方法获取训练集:从具有N个样本的总训练集中有放回地随机抽取n个组成单棵树的训练集,所述训练集是输入训练集S1;2)随机选取节点效用指标:设RF模型共有M个效用指标,指定正整数m(m<<M),Breiman推荐m取M的平方根;随机从M个指标中选取m个作为节点指标;3)节点递归分割:对于每一节点效用指标都要遍历所有可能的分割方法,选择最小的基尼值Gini作为此节点的分割标准,对应的效用指标为最优分割效用指标,按最优分割效用指标进行分割;对于节点2,数据集S2被最优效用分割指标的一阈值t2分为两个子数据集1和S3;其中子集1节点的基尼指数Gini通过设定阈值判断,认为所有样板所属同一类别,所述类别为效用级别1,不用继续分割,而数据集S3则继续分割;节点基尼指数用于描述节点的不纯度,计算见下式:式中,p(j|t)为效用等级j在t节点处的概率,Gini(t)为0时,表示在t节点处的样本数
据为同一效用级别;Gini(t)越大,表明在t节点处的样本数据越趋于平均分布,能获得有用信息越小;4)任意生长,不进行剪枝;(4)模型泛化误差与效用指标重要性计算RF采用Bagging算法集成训练集,样本容量为N的总训练集D中每个样本未被抽取的概率为(1

1/N)
N
,当N足够大时,表明D中1/3的样本不会出现在Bootstrap采样子集中,数据成为袋外OOB数据;在效用分类树生成后,利用OOB数据得出该棵树的错误分类率,所述错误分类率是OOB误差;对森林中所有树的OOB误差取平均作为模型的泛化误差;RF对效用指标的重要性进行计算的方法包括以下两种:1)对每棵树,计算OOB误差E
OOB1
,对效用指标i的数据加入噪声并计算OOB误差E
OOB2
;将E
OOB1
与E
OOB2
的差对所有树取平均,并用标准差归一化,得到效用指标i的重要性;2)计算效用指标i在节点...

【专利技术属性】
技术研发人员:黄军林陈健武佳炜梁超罗格琦马胜兰
申请(专利权)人:湖南师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1