一种城市地理信息数据仓库的构建方法技术

技术编号:7917730 阅读:202 留言:0更新日期:2012-10-25 02:48
本发明专利技术公开了一种城市地理信息数据仓库的构建方法,当原始空间数据存在缺失数据、重复数据或异常数据时进行处理,根据时间型数据、空间型数据和时空混合型数据的空间特征表示,采用标准差方法将各个纪录值减去纪录值平均值,再除以纪录值标准差,获取处理后数据;通过处理后数据构建基于空间特征的模型,获取城市地理信息数据仓库;监视原始空间数据中的数据变化,根据设计特征对象数据表抽取更新数据,当到达预设时间时,将更新数据添加到城市地理信息数据仓库中。本发明专利技术提高了查询和分析的效率,提高了监控效率,减少了数据抽取费用。

【技术实现步骤摘要】

本专利技术涉及城市地理信息系统领域,特别涉及。
技术介绍
GIS (Geographic Information System,地理信息系统)已成为存忙、管理、查询、简单分析和结果展示的管理应用型信息系统,它主要以空间数据管理为目的,利用计算机相关技术对空间数据和属性数据进行存储和管理,并进行相对简单的辅助决策分析,经过多年努力,其相关技术和工具已日臻完善,并逐渐走向成熟。随着社会的多元化发展,各个城市都收集和存储了大量的空间基础数据和行业属 性数据,并且时刻以TB级别的速度在增长。专利技术人在实现本专利技术的过程中,发现现有技术中至少存在以下的缺点和不足这些海量数据在一定程度上已经超出了传统地理信息系统的分析和处理能力,使得查询和分析的效率较慢,例如天津市城市地理信息数据已从GB、TB到PB量级海量急速增长,传统地理信息系统在处理海量数据时,图形浏览和打印输出等待时间较长,无法满足对高性能、大容量分布式存储和管理的要求。其次,传统数据仓库在处理空间数据时有很大局限,无法支持空间特征数据,通常将他们转化为非空间数据进行处理,导致丢失了很多空间特征,使得处理结果不准确。例如城市地理信息数据是面向空间的,具有空间维度和空间度量,能做各种空间数据分析,统计分析天津市工业用地的空间结构及其形态变化趋势,传统数据仓库实现困难,因为传统数据仓库主要针对非空间数据,将空间数据转换为非空间数据时,丢失了工业用地的空间特征和时态特征、拓扑关系等特征。
技术实现思路
本专利技术提供了,本专利技术实现了从城市地理数据转换为空间地理特征及其组成关系,把具有相同属性和关系的实体抽象成一个特征,使得处理结果准确,提高了查询和分析的效率,详见下文描述—种城市地理信息数据仓库的构建方法,所述方法包括以下步骤(I)构建原始空间数据,采用人机交互方式将所述原始空间数据分为时间型数据、空间型数据和时空混合型数据,将所述时间型数据、所述空间型数据和所述时空混合型数据导入数据仓库;(2)判断所述原始空间数据是否存在缺失数据、重复数据或异常数据,如果是,对所述缺失数据、所述重复数据或所述异常数据进行处理,执行步骤(3);如果否,执行步骤(3);(3)根据所述时间型数据、所述空间型数据和所述时空混合型数据的空间特征表示,采用标准差方法将各个纪录值减去纪录值平均值,再除以纪录值标准差,获取处理后数据;(4)通过所述处理后数据构建基于空间特征的模型,获取城市地理信息数据仓库;(5)监视所述原始空间数 据中的数据变化,根据设计特征对象数据表抽取更新数据,当到达预设时间时,将所述更新数据添加到所述城市地理信息数据仓库中。所述判断所述原始空间数据是否存在缺失数据、重复数据或异常数据,如果是,对所述缺失数据、所述重复数据或所述异常数据进行处理具体包括I)判断所述空间型数据是否存在缺失数据,如果是,执行步骤2);如果否,执行步骤3);2)对所述空间型数据采用线性回归法填补缺失数据),,执行步骤3);3)对同类别数据进行对比分析,判断在预设误差范围内是否存在重复记录,如果是,执行步骤4);如果否,执行步骤5);4)删除所述重复记录,执行步骤5);5)对所述异常数据进行检测,当存在异常点时,删除所述异常点。所述缺失数据$具体为权利要求1.,其特征在于,所述方法包括以下步骤 (1)构建原始空间数据,采用人机交互方式将所述原始空间数据分为时间型数据、空间型数据和时空混合型数据,将所述时间型数据、所述空间型数据和所述时空混合型数据导入数据仓库; (2)判断所述原始空间数据是否存在缺失数据、重复数据或异常数据,如果是,对所述缺失数据、所述重复数据或所述异常数据进行处理,执行步骤(3);如果否,执行步骤(3); (3)根据所述时间型数据、所述空间型数据和所述时空混合型数据的空间特征表示,采用标准差方法将各个纪录值减去纪录值平均值,再除以纪录值标准差,获取处理后数据; (4)通过所述处理后数据构建基于空间特征的模型,获取城市地理信息数据仓库; (5)监视所述原始空间数据中的数据变化,根据设计特征对象数据表抽取更新数据,当到达预设时间时,将所述更新数据添加到所述城市地理信息数据仓库中。2.根据权利要求I所述的,其特征在于,所述判断所述原始空间数据是否存在缺失数据、重复数据或异常数据,如果是,对所述缺失数据、所述重复数据或所述异常数据进行处理具体包括 1)判断所述空间型数据是否存在缺失数据,如果是,执行步骤2);如果否,执行步骤3); 2)对所述空间型数据采用线性回归法填补缺失数据$,执行步骤3); 3)对同类别数据进行对比分析,判断在预设误差范围内是否存在重复记录,如果是,执行步骤4);如果否,执行步骤5); 4)删除所述重复记录,执行步骤5); 5)对所述异常数据进行检测,当存在异常点时,删除所述异常点。3.根据权利要求2所述的,其特征在于,所述缺失数据1 具体为 Y^a + hx^i = l,2,3,n,n的取值是正整数,a和b为回归系数;4.根据权利要求2所述的,其特征在于,所述对所述异常数据进行检测,当存在异常点时,删除所述异常点具体包括 对所述空间型数据采用移动曲面拟合法实现所述异常点检测;对所述时间型数据和所述时空混合型数据,采取基于移动窗口和标准差理论的方法实现对所述异常点的检测。5.根据权利要求I所述的,其特征在于,所述纪录值的标准差具体为6.根据权利要求I所述的,其特征在于,所述通过所述处理后数据构建基于空间特征的模型,获取城市地理信息数据仓库具体包括 1)将空间地理特征分为简单地理特征和复杂地理特征,所述复杂地理特征由所述简单地理特征聚集而成,其中,所述简单地理特征具体为点特征、线特征和面特征; 2)建立空间特征数据分类体系; 3)设计空间特征集合,并且给所有的空间特征赋不同的基本特征标识码; 4)定义特征类型整体描述、特征语义对象和集合对象,获取设计特征对象数据表; 5)将所述处理后数据导入所述设计特征对象数据表,获取所述城市地理信息数据仓库。7.根据权利要求I所述的,其特征在于,所述城市地理信息数据仓库具体为 U= {ul, u2, u3, u4, u5} = {地学特征,居住公建,交通运输类,辅助建筑结构,生命体};ul={ull} = ■[城市} ;ull={ulll} = {陆地} ;u2={u21} = {建筑物} ;u21={u211} = {避难所};u3={u31} = {陆地交通运输} ;u31={u311, u312} = {铁路,公路} ;u4={u41} = {城市部件};u41={u411, u412} = {显示牌,柱状物} ;u5={u51} = {植物} ;u51={u511, u512} = {树木,绿地}。全文摘要本专利技术公开了,当原始空间数据存在缺失数据、重复数据或异常数据时进行处理,根据时间型数据、空间型数据和时空混合型数据的空间特征表示,采用标准差方法将各个纪录值减去纪录值平均值,再除以纪录值标准差,获取处理后数据;通过处理后数据构建基于空间特征的模型,获取城市地理信息数据仓库;监视原始空间数据中的数据变化,根据设计特征对象数据表抽取更新数据,当到达预设时间时,将更新数据添加到城市地本文档来自技高网...

【技术保护点】
一种城市地理信息数据仓库的构建方法,其特征在于,所述方法包括以下步骤:(1)构建原始空间数据,采用人机交互方式将所述原始空间数据分为时间型数据、空间型数据和时空混合型数据,将所述时间型数据、所述空间型数据和所述时空混合型数据导入数据仓库;(2)判断所述原始空间数据是否存在缺失数据、重复数据或异常数据,如果是,对所述缺失数据、所述重复数据或所述异常数据进行处理,执行步骤(3);如果否,执行步骤(3);(3)根据所述时间型数据、所述空间型数据和所述时空混合型数据的空间特征表示,采用标准差方法将各个纪录值减去纪录值平均值,再除以纪录值标准差,获取处理后数据;(4)通过所述处理后数据构建基于空间特征的模型,获取城市地理信息数据仓库;(5)监视所述原始空间数据中的数据变化,根据设计特征对象数据表抽取更新数据,当到达预设时间时,将所述更新数据添加到所述城市地理信息数据仓库中。

【技术特征摘要】

【专利技术属性】
技术研发人员:才睿俞斌吴广竹殷响林张嘉瑞
申请(专利权)人:天津市规划信息中心
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1