探测地址更新的方法及装置制造方法及图纸

技术编号:8682735 阅读:144 留言:0更新日期:2013-05-09 02:42
本发明专利技术提出了一种用于获取地址更新信息的方法和装置,包括:获取与命名实体的地址更新相关的网页信息;从所述网页信息中抽取表示所述命名实体地址更新线索的关键词;确定所述地址更新的时间及可信度;根据所述时间及可信度确定所述地址更新信息。采用本发明专利技术的方案可以通过获取的网站信息确定地址更新信息。

【技术实现步骤摘要】

本专利技术涉及数据处理技术,尤其是,涉及通过对数据信息进行处理探测地址更新的方法和装置。
技术介绍
随着互联网业务的不断发展,各种电子地图成为辅助人们生活工作的重要工具,而其所提供的电子地图数据信息会因地址的变更、新建建筑、城市规划、道路规划等原因而变得过时。通常,地图数据提供商定期对数据进行更新,然而,这种定期更新费时费力,特别是对于一些新发生的地址变更信息不会被及时发现或者被及时的更新到电子地图数据库中,这种过期的地图数据会影响用户的使用。现有技术中还存在基于用户主动递交的信息对地图数据进行更新的技术方案,然而,该种方法并不能基于散落在网络各处的网页信息进行地址更新信息的发现。因此,用户会因为陈旧的地图数据而造成不便,故需要改进已有的技术,至少在某种程度上改善现有的对地址信息进行更新的技术方案。
技术实现思路
根据本专利技术的第一个方面,提供一种用于获取地址更新信息的方法,包括:获取与命名实体的地址更新相关的网页信息;从所述网页信息中抽取所述命名实体的地址更新线索;确定所述地址更新线索的时间及可信度;根据所述时间及可信度确定出有效的地址更新线索。根据本专利技术的第二个方面,提供一种用于获取地址更新信息的装置,包括:用于获取与命名实体的地址更新相关的网页信息的部件;用于从所述网页信息中抽取所述命名实体的地址更新线索的部件;用于确定所述地址更新线索的时间及可信度的部件;用于根据所述时间及可信度确定出有效的地址更新线索的部件。本专利技术可以改善现有的对地址信息进行更新的方案。附图说明所附权利要求中阐述了被认为是本专利技术的特点的创造性特征。但是,通过参照附图阅读下面对说明性的实施例的详细说明可更好地理解专利技术本身以及其优选使用模式、目标、特征以及优点,在附图中:图1示出了用来实现本专利技术实施方式的示例性计算系统。图2示出了用于获取命名实体的地址变化的方法流程图。图3示出了图2所示的步骤203的确定时间的流程图。图4示出了用于获取命名实体的地址变化的装置示意图。具体实施例所属
的技术人员知道,本专利技术可以体现为系统、方法或计算机程序产品。因此,本专利技术可以具体实现为以下形式,即,可以是完全的硬件、完全的软件(包括固件、驻留软件、微代码等)、或者本文一般称为“电路”、“模块”或“系统”的软件部分与硬件部分的组合。此外,本专利技术还可以采取体现在任何有形的表达介质(medium of expression)中的计算机程序产品的形式,该介质中包含计算机可用的程序码。可以使用一个或多个计算机可读介质的任何组合。计算机可读介质可以是计算机可读信号介质或计算机可读存储介质,计算机可读存储介质例如可以是一但不限于一电的、磁的、光的、电磁的、红外线的、或半导体的系统、装置、器件或传播介质、或前述各项的任何适当的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括以下:有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPR0M或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或前述各项的任何适当的组合。在本文语境中,计算机可读存储介质可以是任何含有或存储供指令执行系统、装置或器件使用的或与指令执行系统、装置或器件相联系的程序的有形介质。计算机可读信号介质可以包括例如在基带中或作为载波的一部分传播的带有计算机可读程序代码的数据信号。这样一种传播信号可以采取任何适当的形式,包括一但不限于一电磁的、光的或其任何适当的组合。计算机可读信号介质可以是不同于计算机可读存储介质的、可以传达、传播或传输供指令执行系统、装置或器件使用的或与指令执行系统、装置或器件相联系的程序的任何一种计算机可读介质。包含在计算机可读介质中的程序代码可以采用任何适当的介质传输,包括-但不限于-无线、有线、光缆、射频等等、或上述各项的任何适当的组合。用于执行本专利技术的操作的计算机程序码,可以以一种或多种程序设计语言的任何组合来编写,所述程序设计语言包括面向对象的程序设计语言一诸如Java、Smalltalk、C++之类,还包括常规的过程式程序设计语言一诸如”C”程序设计语言或类似的程序设计语言。程序码可以完全地在用户的计算上执行、部分地在用户的计算机上执行、作为一个独立的软件包执行、部分在用户的计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在后一种情形中,远程计算机可以通过任何种类的网络一包括局域网(LAN)或广域网(WAN) —连接到用户的计算机,或者,可以(例如利用因特网服务提供商来通过因特网)连接到外部计算机。以下参照按照本专利技术实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本专利技术。要明白的是,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得通过计算机或其它可编程数据处理装置执行的这些指令,产生实现流程图和/或框图中的方框中规定的功能/操作的装置。也可以把这些计算机程序指令存储在能指令计算机或其它可编程数据处理装置以特定方式工作的计算机可读介质中,这样,存储在计算机可读介质中的指令产生一个包括实现流程图和/或框图中的方框中规定的功能/操作的指令装置(instruction means)的制造品。也可以把计算机程序指令加载到计算机或其它可编程数据处理装置上,使得在计算机或其它可编程数据处理装置上执行一系列操作步骤,以产生计算机实现的过程,从而在计算机或其它可编程装置上执行的指令就提供实现流程图和/或框图中的方框中规定的功能/操作的过程。现参看图1,示出了适于用来实现本专利技术实施方式的示例性计算系统100的框图。如所示,计算机系统100可以包括:CPU(中央处理单元)101、RAM(随机存取存储器)102、ROM(只读存储器)103、系统总线104、硬盘控制器105、键盘控制器106、串行接口控制器107、并行接口控制器108、显示控制器109、硬盘110、键盘111、串行外部设备112、并行外部设备113和显示器114。在这些设备中,与系统总线104耦合的有CPU 101、RAM 102、ROM103、硬盘控制器105、键盘控制器106、串行控制器107、并行控制器108和显示控制器109。硬盘110与硬盘控制器105耦合,键盘111与键盘控制器106耦合,串行外部设备112与串行接口控制器107耦合,并行外部设备113与并行接口控制器108耦合,以及显示器114与显示控制器109耦合。应当理解,图1所述的结构框图仅仅为了示例的目的而示出的,而不是对本专利技术范围的限制。在某些情况下,可以根据具体情况而增加或者减少某些设备。参看图2,示出了在一个实施例中用于获取命名实体的地址变化的方法流程图,包括以下步骤:在步骤201中,获取与命名实体的地址相关的数据信息。数据信息包括任何形式存在的 目息,例如来自网络的网页 目息或者存储于各种存储介质中的任何 目息。本申请是以网页信息为例进行说明,但不是对本申请的限定,此处的网页信息特指通过各种设备在网络上随时发布的消息,可通过网络在各个网站上获得本文档来自技高网
...

【技术保护点】
一种用于获取地址更新信息的方法,包括:获取与命名实体的地址更新相关的数据信息;从所述数据信息中抽取所述命名实体的地址更新线索;确定所述地址更新线索的时间及可信度;根据所述时间及可信度确定有效的地址更新线索作为所述地址更新信息。

【技术特征摘要】
1.一种用于获取地址更新信息的方法,包括: 获取与命名实体的地址更新相关的数据信息; 从所述数据信息中抽取所述命名实体的地址更新线索; 确定所述地址更新线索的时间及可信度; 根据所述时间及可信度确定有效的地址更新线索作为所述地址更新信息。2.按权利要求1所述的方法,其特征在于,根据所述数据信息中包括命名实体以及至少一个地址更新关键词,获取与所述命名实体的地址更新相关的数据信息。3.按权利要求1所述的方法,其特征在于,所述地址更新线索包括发生地址更新的命名实体,地址更新关键词以及目标地址。4.按权利要求1所示的方法,其特征在于,所述确定地址更新线索的时间包括: 探测所述数据信息中与所述地址更新线索相关的时间短语; 根据所述时间短语的探测结果确定所述地址更新线索的绝对时间。5.按权利要求4所示的方法,其特征在于,所述根据所述时间短语的探测结果确定出所述地址更新线索的绝对时间包括: 响应于所述时间短语是绝对时间,直接将其确定为所述地址更新线索的时间; 响应于所述时间短语是相对时间,将其转换为绝对时间后确定为所述地址更新线索的时间; 响应于未探测到与所述地址更新线索相关时间术语,直接将所述数据信息发布的时间确定为所述地址更新线索的时间。6.按权利要求1所述的方法,其特征在于,至少根据以下方式之一确定所述可信度: 根据所述数据信息被证实的程度确定,当所述数据信息被证实过,则具有较高的可信度,当所述数据信息仅被转发时,则具有较低的可信度; 根据对所述数据信息的评论获取的支持度信息确定; 根据所述数据信息作者的权威程度确定。7.按权利要求1所述的方法,其特征在于,根据所述时间及所述可信度确定出有效的地址更新线索包括: 选择所述时间在预定时间段内所述可信度最高的地址更新线索,或者 选择所述可信度在预定范围内的并且所述时间最新的地址更新线索。8.按权利要求1所述的方法,其特征在于,进一步包括根据所述有效的地址更新线索中的地址更新关键词确定地址修正操作。9.按权利要求8所述的方法,其特征在于,所述地址修正操作是修改地址、增加新地址、删除地址中的一种或多种。10.按权利要求1所述的方法,进一步包括:根据所述地址更新信息提供地址变更警报,或者直接进行地图数据的更新。11.一种用于获取地址更新信息的装置,包括: 获取部件,被配置为获取与命名实体地址更新相关的数据信息; 地址更新线索抽取部...

【专利技术属性】
技术研发人员:郭宏蕾蔡柯柯祝慧佳张俐苏中
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1