一种基于图像识别的城市数据采集方法及系统技术方案

技术编号:17780422 阅读:51 留言:0更新日期:2018-04-22 09:18
本发明专利技术公开了一种基于图像识别的城市数据采集方法及系统,采用了图像识别相关领域的技术方法,通过结合人工智能和机器学习的技术体系,使影像数据能够真正提取出来应用于城市分析当中,达到了实时获取城市数据的技术体系,具有大数据+人工智能的技术优势,和借助城市影像数据真正提升城市运行管理能力意义。

【技术实现步骤摘要】
一种基于图像识别的城市数据采集方法及系统
本公开涉及城市规划数据采集
,具体涉及一种基于图像识别的城市数据采集方法及系统。
技术介绍
现有技术中,在大数据的数据采集领域中,都是基于结构化或半结构化的数据集或数据文件进行数据采集,缺乏直接基于图像识别的数据采集技术体系。而图像识别的技术体系在城市运行监控领域只能达到初步的人群识别能力应用,没有针对城市整体数据的数据分析识别技术体系。
技术实现思路
鉴于上述问题,提出了本公开以便提供一种克服上述问题或者至少部分地解决上述问题的基于图像识别的城市数据采集方法及系统。根据本公开的一个方面,提供了一种基于图像识别的城市数据采集方法,其包括:获取图像,建立图像识别知识库,并标注需要提取的信息项;根据所述信息项,基于图像识别知识库和遗传算法,对所述图像进行信息提取,得到图像信息;根据城市信息编目,对所述图像信息进行信息分类;根据城市数据标准对所述分类后的图像信息进行数据清洗和指标模型转换,得到城市数据。所述方法还包括:对于所述图像中未能提取到的信息项,纳入图像识别回收库;对所述图像识别回收库中信息项,采用机器学习方法建立图像识别的所述信息项。所述标注需要提取的信息项,具体包括:对于获取到的图像信息,预先对图像中的文件信息进行初步识别;基于图像的命名规则进行正则表达映射,提取所述城市信息编目相关信息;将所述相关信息作为需要提取的信息项。所述图像识别知识库,根据如下方式建立:对所述图像进行图像块的分割;已经成功分割的图像块进行存储,保存图像块关联的原始文件及图像块的图形特征值,建立所述图像识别知识库。所述基于遗传算法对所述图像进行信息提取,包括:对所述图像中模式匹配搜索的位置点进行实数编码;所述实数编码的每一位等位基因的范围根据匹配位置的搜索范围确定;对所述图像中欲分割的图像块种群进行随机初始化;计算所述种群中个体的适应度;通过选择、交叉、变异遗传操作算子对当前所述种群进行操作,产生新的染色体;判断所述种群是否收敛,如果收敛则停止进化;判断所述种群是否达到了规定的繁衍代数,如果达到则停止并返回最好的染色体,作为图像块。所述指标模型转换,包括:基础指标与计算指标,指标体系实现分为指标分组、指标项、指标数据、维度关联;当所述图像完成数据提取后,将具体提取的数据与指标体系中的指标项进行关联,完成指标模型转换。根据本公开的另一个方面,提供了一种基于图像识别的城市数据采集系统,包括:图像文件管理单元,用于系统接入的图像文件管理及初步的图像信息提取;图像识别管理单元,用于针对所述图像中的信息进行识别提取管理;城市数据管理单元,用于实现城市数据的管理功能;数据库管理单元,用于建立和管理原始文件信息库、图像识别知识库、图像识别算法库、图像识别回收库、城市信息编目库和城市数据指标库。所述图像文件管理单元,具体包括:文件接入模块,用于实现所述图像文件的接入管理;通过在线文件上传、文件压缩包上传、FTP下载、件服务器下载、图像流方式接收文件;原始信息提取模块,用于基于所述图像的文件信息进行初步的信息提取,并针对提取的信息项进行初步的图像过滤;城市编目信息项预定义模块,用于将提取的信息项映射到城市编目信息体系中。所述图像识别管理单元,具体包括:分类特征识别模块,用于基于所述图像的特征进行特征提取,图像分割,并针对分割结构内容进行信息项特征识别过滤;信息项提取模块,用于基于分割的图像进行城市信息项提取;编目关联模块,用于基于提取的城市信息项关联城市信息编目体系;指标关联模块,用于将提取信息项中的指标数据进行指标体系的关联;计算资源管理模块,用于图像识别的任务节点计算资源占用情况管理;任务调度管理模块,用于针对图像识别任务的分布式的任务拆分,任务的启动、停止、调度管理,实现整体的任务监控管理;日志管理模块,用于针对图像识别任务进行日志管理,包括运行日志,异常日志;存储空间管理模块,用于针对图像识别占用的临时文件存储空间进行管理;知识库管理模块,用于针对图像识别历史提取内容进行索引建库,实现同类图像的识别或者是总图、子图的关系识别;识别算法管理模块,用于针对图像识别中的计算方法进行管理,定义算法的输入、输出、过程描述、算法包,并记录算法包的使用频率及准确率。所述城市数据管理单元,具体包括:城市编目管理模块,用于实现城市编目数据的管理;指标体系管理模块,用于实现城市指标的汇聚管理,实现内容包括基础指标、计算指标,指标体系;具体实现分为指标分组、指标项、指标数据、维度关联;城市数据管理模块,用于针对提取的城市数据进行汇聚管理。根据本公开上述的一个或多个技术方案,其提供了一种基于图像识别的城市数据采集的方案,采用了图像识别相关领域的技术方法,通过结合人工智能和机器学习的技术体系,使影像数据能够真正提取出来应用于城市分析当中,达到了实时获取城市数据的技术体系,具有大数据+人工智能的技术优势,和借助城市影像数据真正提升城市运行管理能力意义。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本公开的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了根据本公开一个实施例的基于图像识别的城市数据采集方法的流程图;图2示出了本公开一个实施例中城市的原始遥感图像;图3示出了本公开一个实施例中城市数据分析展现结果图;图4示出了根据本公开一个实施例的基于图像识别的城市数据采集系统的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。本公开各个实施例的方案,通过借助大数据的海量数据采集能力,结合城市数据编目体系,针对城市影像的识别专题,实现图像获取-》城市数据识别-》大数据采集的整体流程。而本专利的实现目标,就是通过改善图像识别的技术弥补城市数据识别采集的领域空白,实现基于城市影像的城市数据采集功能。实施例一图1示出了本实施例的基于图像识别的城市数据采集方法流程图,参照图1,所述方法可以包括:步骤11,获取图像,建立图像识别知识库,并标注需要提取的信息项。系统通过图像文件管理模块接入图像信息后,需要预先对图像中的文件信息进行初步识别,依据原始文件信息库中的,首先基于图像的命名规则进行正则表达映射,提取基础城市编目相关信息,如城市名称、时间、图像类别等内容,为后续的图像信息过滤提取提供数据输入。步骤12,根据所述信息项,基于图像识别知识库和遗传算法,对所述图像进行信息提取,得到图像信息。图像识别知识库是对已经成功分割的图像块进行存储,保存图像块关联的原始文件及图像块的图形特征值,为图像数据的过滤提供支持。图像识别的信息提取。图像识别问题的数学本质属于模式空间到类别空间的映射问题。目前,在图像识别的发展中,主要有三种识别方法:统计模式识别、结构模式识别、模糊模式识别。图像分割是图像处理中的一项关键技术,现有的图像分割的方法有许多种,如基于数学形态学的图像分割、基于本文档来自技高网...
一种基于图像识别的城市数据采集方法及系统

【技术保护点】
一种基于图像识别的城市数据采集方法,其特征在于,包括:获取图像,建立图像识别知识库,并标注需要提取的信息项;根据所述信息项,基于图像识别知识库和遗传算法,对所述图像进行信息提取,得到图像信息;根据城市信息编目,对所述图像信息进行信息分类;根据城市数据标准对所述分类后的图像信息进行数据清洗和指标模型转换,得到城市数据。

【技术特征摘要】
1.一种基于图像识别的城市数据采集方法,其特征在于,包括:获取图像,建立图像识别知识库,并标注需要提取的信息项;根据所述信息项,基于图像识别知识库和遗传算法,对所述图像进行信息提取,得到图像信息;根据城市信息编目,对所述图像信息进行信息分类;根据城市数据标准对所述分类后的图像信息进行数据清洗和指标模型转换,得到城市数据。2.如权利要求1所述的方法,其特征在于,所述方法还包括:对于所述图像中未能提取到的信息项,纳入图像识别回收库;对所述图像识别回收库中信息项,采用机器学习方法建立图像识别的所述信息项。3.如权利要求1所述的方法,其特征在于,所述标注需要提取的信息项,具体包括:对于获取到的图像信息,预先对图像中的文件信息进行初步识别;基于图像的命名规则进行正则表达映射,提取所述城市信息编目相关信息;将所述相关信息作为需要提取的信息项。4.如权利要求1所述的方法,其特征在于,所述图像识别知识库,根据如下方式建立:对所述图像进行图像块的分割;已经成功分割的图像块进行存储,保存图像块关联的原始文件及图像块的图形特征值,建立所述图像识别知识库。5.如权利要求4所述的方法,其特征在于,所述基于遗传算法对所述图像进行信息提取,包括:对所述图像中模式匹配搜索的位置点进行实数编码;所述实数编码的每一位等位基因的范围根据匹配位置的搜索范围确定;对所述图像中欲分割的图像块种群进行随机初始化;计算所述种群中个体的适应度;通过选择、交叉、变异遗传操作算子对当前所述种群进行操作,产生新的染色体;判断所述种群是否收敛,如果收敛则停止进化;判断所述种群是否达到了规定的繁衍代数,如果达到则停止并返回最好的染色体,作为图像块。6.如权利要求1所述的方法,其特征在于,所述指标模型转换,包括:基础指标与计算指标,指标体系实现分为指标分组、指标项、指标数据、维度关联;当所述图像完成数据提取后,将具体提取的数据与指标体系中的指标项进行关联,完成指标模型转换。7.一种基于图像识别的城市数据采集系统,其特征在于,包括:图像文件管理单元,用于系统接入的图像文件管理及初步的图像信息提取;图像识别管理单元,用于...

【专利技术属性】
技术研发人员:朱瑾鹏
申请(专利权)人:北京数洋智慧科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1