一种地址匹配的方法和系统技术方案

技术编号:2820693 阅读:306 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种地址匹配的方法和系统,所述方法可以包括:接收原始地址信息;对所述原始地址信息进行分词,获得包括地址要素和门牌号的分词结果;依据所述分词结果中的地址要素和门牌号,在预置的第一数据库中进行检索,获得匹配结果,并根据匹配结果,赋予各匹配结果相应的第二匹配度;所述匹配结果包括地理坐标信息。本发明专利技术能够非常简单、方便将文字性描述的地理位置信息转化成可以被GIS系统利用的地理坐标,它将极大的方便数据人员的采集工作,大规模的扩充地理数据。它提供的地址匹配服务也将为邮递员投递、114查询、数据分析、客户信息管理等很多应用方面提供基础平台。

【技术实现步骤摘要】

本专利技术涉及地理信息数据处理领域,特别是涉及一种地址匹配的方法和系统
技术介绍
地理信息系统(GIS, Geographic Information System)是一种基于计算机的 工具,它可以对在地球上存在的东西和发生的事件进行成图和分析。GIS技术 把地图这种独特的视觉化效果和地理分析功能与一般的数据库操作(例如查询 和统计分析等)集成在一起。这种能力使GIS与其他信息系统相区别,从而使 其在广泛的公众和个人、企事业单位中解释事件、预测结果、规划战略等中具 有实用价值。地理信息系统技术的应用已经从专业领域走到社会生活和工作的方方面 面,从城市的规划管理,到投递员的投递线路,凡是与地理位置相关的信息, 都可以利用地理信息系统技术来管理。没有地图,就无从谈及地理信息系统。 由此,引申了这样一个问题一一这些地图从哪里来?我们通常说的地图,是由 国家专业的职能部门来完成各种比例尺地图的生产和制作,这些地图表现了基 本的地理面貌一一山川河流的分布,城市道路、街区分布等等。但是, <义仅是 这样地图信息是远远不能适应我们的需求,很多人文、经济信息都与地理位置 相关,而这些信息是无法在基础地图中得到的。这些信息的原始载体都是地址 一一学校、医院、各类工商企业、居住地址等等,这些地址信息都在相关的专 业部门管理,但这些载有地理位置的地址仅仅是文字描述,并没有转化成地理 空间位置,这些信息的空间地理位置图该怎样得到?传统的方法,我们称之为 "扫街",就是通过人工的方法,到实地去采集地址的坐标(如利用手持GPS 定位仪等等),然后再将这些采集的坐标点制作成图。"扫街"的方法有很多弊 端,最明显的就是生产周期长,人力资源成本高。而且,对于每个单位来说, 扫街采集地址位置还存在实施的难度,对于大数据量的点位分布图,几乎无法 满足实际应用的需要。因此,迫切需要本领域技术人员解决的技术问题之一就是如何提出一种地址匹配的解决方案,能够由计算机自动执行,简单、方便地将文字性描述的 地理位置信息转化成可以被GIS系统利用的地理坐标。
技术实现思路
本专利技术所要解决的技术问题是提供一种地址匹配的方法和系统,能够非常简单、方便将文字性描述的地理位置信息转化成可以被GIS系统利用的地理坐标。为了解决上述问题,依据本专利技术的实施例,公开了一种地址匹配的方法, 包括接收原始地址信息;对所述原始地址信息进行分词,获得包括地址要素 和门牌号的分词结果;所述地址要素依据预置的地址分词库对所述原始地址信 息分词得到;所述地址分词库中存储有多个标准地址要素;依据所述分词结果 中的地址要素和门牌号,在预置的第一数据库中进行检索,获得匹配结果,并 根据匹配结果,赋予各匹配结果相应的第二匹配度;所述匹配结果包括地理坐 标信息。进一步,当分词结果包括至少两个地址要素时,还包括判断前后两个地 址要素是否符合预置的父子级别关系,并根据判断结果,赋予该分词结果相应 的第一匹配度。进一步,当所述分词结果中还包括地物名称时,该方法还包括获取所述 分词结果中最大匹配要素的地理坐标;确定包含该地理坐标的地理范围;依据 所确定的地理范围,以所述分词结果中包括的地物名称为关键词,在预置的第 二数据库中进行地理空间和关4A词的组合搜索,获得匹配结果,并依据匹配情 况赋予该匹配结果相应的第三匹配度。进一步,当所述原始地址信息中还包括属性信息时,该方法还包括依据 该属性信息,对所得的匹配结果进行过滤。进一步,该方法还包括计算每条匹配结果的综合匹配度,并排序输出。依据本专利技术的另一实施例,还公开了一种地址匹配的方法,包括接收原 始地址信息;对所述原始地址信息进行分词,获得包括地址要素和地物名称的 分词结果;所述地址要素依据预置的地址分词库对所述原始地址信息分词得 到;所述地址分词库中存储有多个标准地址要素及其相应的地理坐标;获取所 述分词结果中最大匹配要素的地理坐标;确定包含该地理坐标的地理范围;依据所确定的地理范围,以所述分词结果中包括的地物名称为关4建词,在预置的 第二数据库中进行地理空间和关键词的组合搜索,获得匹配结果,并依据匹配情况赋予该匹配结果相应的第三匹配度;所述匹配结果包括地理坐标信息。 优选的,当分词结果包括至少两个地址要素时,该方法还包括判断前后两个地址要素是否符合预置的父子级别关系,并根据判断结果,赋予该分词结果相应的第一匹配度。优选的,当分词结果还包括门牌号时,该方法还包括依据所述分词结果中的地址要素和门牌号,在预置的第一数据库中进行检索,获得匹配结果,并根据匹配结果,赋予各匹配结果相应的第二匹配度;所述匹配结果包括地理坐标信息。优选的,当所述原始地址信息中还包括属性信息时,该方法还包括依据 该属性信息,对所得的匹配结果进行过滤。优选的,该方法还包括计算每条匹配结果的综合匹配度,并排序输出。 依据本专利技术的另一实施例,还公开了一种地址匹配的方法,包括接收原 始地址信息;对所述原始地址信息进行分词,获得包括至少两个地址要素的分 词结果;所述地址要素依据预置的地址分词库对所述原始地址信息分词得到; 所述地址分词库中存储有多个标准地址要素;判断所述分词结果中前后两个地 址要素是否符合预置的父子级别关系,并根据判断结果,赋予各分词结果相应 的第一匹配度;如果所述分词结果中还包括门牌号,则依据所述分词结果中的 地址要素和门牌号,在预置的第一数据库中进行检索,获得匹配结果,并依据 匹配情况赋予该匹配结果相应的第二匹配度;所述匹配结果包括地理坐标信 息;如果所述分词结果中还包括地物名称,则获取所述分词结果中最大匹配要 素的地理坐标;确定包含该地理坐标的地理范围;依据所确定的地理范围,以 所述分词结果中包括的地物名称为关键词,在预置的第二数据库中进行地理空 间和关键词的组合搜索,获得匹配结果,并依据匹配情况赋予该匹配结果相应 的第三匹配度;所述匹配结果包括地理坐标信息;针对各匹配结果计算综合匹 配度,排序输出。优选的,当所述原始地址信息中还包括属性信息时,还包括依据该属性 信息,对所得的匹配结果进行过滤。相应的,本专利技术还提供了一种地址匹配的系统,包括接收器,用于接收 原始地址信息;地址分词器,用于对所述原始地址信息进行分词,获得包括地址要素和门牌号的分词结果;所述地址要素依据预置的地址分词库对所述原始地址信息分词得到;所述地址分词库中存储有多个标准地址要素;门牌检索器, 用于依据所述分词结果中的地址要素和门牌号,在预置的第一数据库中进行4企 索,获得匹配结果,并根据匹配结果,赋予各匹配结果相应的第二匹配度;所 述匹配结果包括地理坐标信息。进一步,当分词结果包括至少两个地址要素时,该系统还包括位于地址 分词器中的判断模块,用于判断前后两个地址要素是否符合预置的父子级别关 系,并根据判断结果,赋予该分词结果相应的第一匹配度。进一 步,当所述分词结果中还包括地物名称时,该系统还包括空间搜索器, 所述空间搜索器进一步包括获取模块,用于获取所述分词结果中最大匹配要 素的地理坐标;确定模块,用于确定包含该地理坐标的地理范围;搜索模块, 用于依据所确定的地理范围,以所述分词结果中包括的地物名称为关键词,在 预置的第二数据库中进行地理空间和关键词的组合搜索,获得匹配结果,并依 据匹本文档来自技高网
...

【技术保护点】
一种地址匹配的方法,其特征在于,包括: 接收原始地址信息; 对所述原始地址信息进行分词,获得包括地址要素和门牌号的分词结果;所述地址要素依据预置的地址分词库对所述原始地址信息分词得到;所述地址分词库中存储有多个标准地址要素; 依据所述分词结果中的地址要素和门牌号,在预置的第一数据库中进行检索,获得匹配结果,并根据匹配结果,赋予各匹配结果相应的第二匹配度;所述匹配结果包括地理坐标信息。

【技术特征摘要】

【专利技术属性】
技术研发人员:张高峰陈文斌孙亚夫孙茳
申请(专利权)人:北京灵图软件技术有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1