一种通信地址查询邮政编码的系统及终端技术方案

技术编号:9434639 阅读:319 留言:0更新日期:2013-12-12 00:40
本发明专利技术提供一种通信地址查询邮政编码的系统,该系统包括通信地址输入子系统和邮政编码查询子系统;所述地址输入子系统通过对用户输入文本进行实时提示,用户根据提示列表地址确定待查询的通信地址;所述邮政编码查询子系统将待查询的通信地址进行标准化并检索出最接近的标准化通信地址,同时返回该标准化通信地址对应的邮政编码。本发明专利技术通过帮助用户输入提示,使得查询格式更加自由;基于命名实体识别技术能够标识出用户输入地址元数据的级别,从而实现地址的逐级查询,同时对通信地址进行补全,使得查询结果更加精确,另外用户还可以将查询结果以二维码的方式获取,或者链接地图进行定位。另外,本发明专利技术还提供一种通信地址查询邮政编码的终端。

【技术实现步骤摘要】
【专利摘要】本专利技术提供一种通信地址查询邮政编码的系统,该系统包括通信地址输入子系统和邮政编码查询子系统;所述地址输入子系统通过对用户输入文本进行实时提示,用户根据提示列表地址确定待查询的通信地址;所述邮政编码查询子系统将待查询的通信地址进行标准化并检索出最接近的标准化通信地址,同时返回该标准化通信地址对应的邮政编码。本专利技术通过帮助用户输入提示,使得查询格式更加自由;基于命名实体识别技术能够标识出用户输入地址元数据的级别,从而实现地址的逐级查询,同时对通信地址进行补全,使得查询结果更加精确,另外用户还可以将查询结果以二维码的方式获取,或者链接地图进行定位。另外,本专利技术还提供一种通信地址查询邮政编码的终端。【专利说明】一种通信地址查询邮政编码的系统及终端
本专利技术涉及邮政编码查询领域,尤其涉及一种通信地址查询邮政编码的系统及终端。
技术介绍
随着电子商务的突飞猛进和物流行业的信息化,使得人们在足不出户的情况下完成购物和邮寄物品,大大节约了时间和金钱成本。电子商务和物流行业都离不开通信地址(又称为通讯地址,简称为地址)和邮编,这些数据都需要用户提供,当前一些电子商务网站和物流行业的主要的做法如下:让用户手工输入完整的地址和地址对应的邮编;通过下拉列表提供省,省下面地级市和地级市下面的区县,这些比较固定的地址让用户选择,余下的地址和邮编由用户手工输入;保留用户输入的地址和邮编,方便下次再次使用,即如果本次输入的地址和邮编之前已经有了一份,直接选中,就避免了让用户重复输入。上述做法主要存在的问题如下:很多情况下用户未必知道自己输入的地址对应的邮编;由于基于拼音的输入法和汉语本身存在的缺陷(汉字存在多音字,多个汉字拥有相同的读音,多数基于拼音的输入法都是基于统计的语言模型),再加上地址中存在的一些生僻字的原因会导致输入的地址存在错别字;由于地名存在别名现象,即同一个地名有多种叫法,例如“广东省”的别名有“广东”和“粤”,因此他们识别不了对同一个地名的不同描述;有些情况下用户无法输入完整的地址,当输入的时候一脸茫然和无助;由于地址存在变更和搜集不完全的问题,这些网站的数据往往得不到更新。当前一些其他的网站能够解决第一个问题,即帮助用户得到地址对应的邮编。但是他们往往采用数据库技术来实现的系统,对于低于区县级别的地址,往往采用字串模糊查询(like %XXX%)的方式参与检索,由于性能的原因此种方式对于大数据量的查询效率很差。另外基于数据库实现的查询使得用户的输入格式和内容受到了很大的限制,比如: 用户首先选择省级行政区(包括省、特别行政区、自治区和直辖市)的名字,其次是选择地级行政区(包括地级市、自治州、地区和盟)级别的名字,然后再县级行政区(包括市辖区、县、旗、特区、林区、自治县和自治旗等)级别的名字,最后用户输入乡镇级别及村庄道路等。查询的输入过程非常机械。另外基于数据库的查询模式,要求地址格式全部满足四级,即省级,地级市级,区县级,然后是其他具体地址。但是并不是所有的地址都满足此种情况,例如直辖市下和省与直辖县或省直辖县级市之间就没有地级市级,一些特殊的地级市没有区县级,如广东省中山市、广东省东莞市、海南省三亚市、海南省三沙市、甘肃省嘉峪关市;他们的解决办法,起个其他的名字代替,例如“直辖区县”,“市辖区”,“省直辖县”等,但是查询的结果中一般也包含这些非真正地址的数据。所以需要一种实现帮助用户输入提示,给出完整的参考地址,并将待查询地址进行标准化的精确查询邮政编码的系统。
技术实现思路
为此,本专利技术为了解决上述缺陷之一。因而,本专利技术提供一种通信地址查询邮政编码的系统及终端,通过帮助用户输入提示,使得查询格式更加自由;基于命名实体识别技术能够标识出用户输入地址元数据的级别,从而实现地址的逐级查询,同时对通信地址进行补全,使得查询结果更加精确,另外用户还可以将查询结果以二维码的方式获取,或者链接地图进行定位。所以,本专利技术一个实施例提供一种通信地址查询邮政编码的系统,该系统包括通信地址输入子系统和邮政编码查询子系统;所述地址输入子系统通过对用户输入文本进行实时提示,用户根据提示列表地址确定待查询的通信地址;所述邮政编码查询子系统将待查询的通信地址进行标准化并检索出最接近的标准化通信地址,同时返回该标准化通信地址对应的邮政编码。优选地,所述确定待查询的通信地址还可以包括:用户可以不选择提示列表中的地址,仅根据用户输入文本确定待查询的通信地址。所述实时提示包括:随着用户输入本文的每一次增加来自动改变提示内容;所述提示内容的实现步骤具体为:获取当前用户输入的地址文本并进行预处理,删除多余的空格;进行地址切分获得地址元数据,并标注所有的地址等级;通过地名实体识别获得最终的地名实体标注序列,并生成Query查询语句;检索索引地址文件,获得提示列表地址内容。优选地,所述预处理还包括:将数字或字母的全角字符转换为半角字符;所述预处理过程中字典采用基于双数组的Trie树数据结构进行存储。所述提示列表地址包括:获得的提示列表地址根据最接近的标准地址按降序排列。所述将待查询的通信地址进行标准化包括以下具体步骤:获取用户确定的待查询通信地址并进行预处理;进行地址切分获得地址元数据,并标注所有的地址等级;通过地名实体识别获得最终的地名实体标注序列,并生成Query查询语句;解析Query查询语句并检索索引文件与之比对,获得最接近的通信地址;进行地址补全生成标准化通信地址,并返回该标准化通信地址对应的邮政编码。优选地,所述对应的邮政编码根据标注地址的最低地址等级值来确定。所述返回该标准化通信地址对应的邮政编码还可以包括:选择确定的邮政编码查询结果,用户可以获取地图定位;或通过二维码将邮政编码查询结果发送到移动终端设备上。优选地,所述地址切分采用二元模型的分词方法;所述命名实体识别技术识别出地名实体标注结果中每一个地名元数据最可能的地址等级。本专利技术另一个实施例提供一种通信地址查询邮政编码的终端,所述终端包括:用户输入提示单元和邮政编码查询单元,其中,所述用户输入提示单元,用以实时提示用户输入并接收用户最终确定的待查询通信地址;所述邮政编码查询单元,用以检索出与待查询通信地址最接近的标准化通信地址,并接收与该标准化通信地址对应的邮政编码。本专利技术通过帮助用户输入提示,使得查询格式更加自由;基于命名实体识别技术能够标识出用户输入地址元数据的级别,从而实现地址的逐级查询,同时对通信地址进行补全,使得查询结果更加精确,另外用户还可以将查询结果以二维码的方式获取,或者链接地图进行定位。【专利附图】【附图说明】图1是本专利技术实施例实现的一种通信地址查询邮政编码的系统的流程示意图。图2是本专利技术实施例实现的地址输入子系统的详细流程示意图。图3是本专利技术实施例实现的地址输入子系统的详细流程示意图。图4是本专利技术实施例实现的邮政编码查询子系统中地址补全的实例示意图。【具体实施方式】为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步的详细说明。应当理解,此处所描述的具体实施例仅仅用于解释本专利技术,并不用于限定本专利技术。本专利技术提供的一种通信地址查询邮政编码的系统及终端,通过帮助用户输入提示,使得查询格式更加自由;基于本文档来自技高网
...

【技术保护点】
一种通信地址查询邮政编码的系统,其特征在于,该系统包括通信地址输入子系统和邮政编码查询子系统;所述地址输入子系统通过对用户输入文本进行实时提示,用户根据提示列表地址确定待查询的通信地址;所述邮政编码查询子系统将待查询的通信地址进行标准化并检索出最接近的标准化通信地址,同时返回该标准化通信地址对应的邮政编码。

【技术特征摘要】

【专利技术属性】
技术研发人员:王国印贾西贝
申请(专利权)人:深圳市华傲数据技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1