地址数据处理方法和装置制造方法及图纸

技术编号:15792105 阅读:336 留言:0更新日期:2017-07-09 23:21
本发明专利技术公开了一种地址数据处理方法和装置,涉及互联网技术领域。其中的方法包括:获取预定区域内地址数据对应的经纬度坐标;根据预定区域内地址数据对应的经纬度坐标将预定区域分为多个区间;根据各区间的坐标密度识别出坐标密集区域;将坐标密集区域内的坐标作为标准地址坐标。本发明专利技术使得在筛选地址和坐标时更加准确、快速,能更好的为地址服务提供数据基础。

【技术实现步骤摘要】
地址数据处理方法和装置
本专利技术涉及互联网
,尤其涉及一种地址数据处理方法和装置。
技术介绍
随着购物、配送公司高速的成长和规模不断的扩大,各种数据量也在疯狂的增长,其中公司订单和妥投数据更为明显,随着渠道下沉战略的实行,妥投地址已经深入乡镇,甚至农村,这些精准、海量的地址数据成为非常宝贵的资源,有效的将这些数据挖掘出来,精准服务于与地址服务相关的业务,如预分拣系统、订单轨迹系统、用户收货地址系统、高精度地图、智能派车等显得尤为必要。现有技术中,在获得地址数据后,通常先进行地址分词,然后根据地址出现频率和阈值进行地址筛选,根据筛选出的地址进行预分拣或配货、派车等服务。但现有技术筛选出的地址精度不高,不能满足部分需求。
技术实现思路
本专利技术实施例要解决的一个技术问题是提供一种能够提高地址筛选准确性的地址数据处理方法和装置。根据本专利技术的一个实施例,提出一种地址数据处理方法,包括:获取预定区域内地址数据对应的经纬度坐标;根据预定区域内地址数据对应的经纬度坐标将预定区域分为多个区间;根据各区间的坐标密度识别出坐标密集区域;将坐标密集区域内的坐标作为标准地址坐标。进一步地,将坐标密集区域内的坐标按照标准地址库的结构进行存储。进一步地,根据预定区域内地址数据对应的经纬度坐标将预定区域分为多个区间包括:确定预定区域内地址数据对应的经度最大值和最小值以及纬度最大值和最小值;将经度最大值和最小值以及纬度最大值和最小值构成的区域等分为多个区间。进一步地,根据各区间的坐标密度识别出坐标密集区域包括:根据各区间对应的坐标数量确定各区间的坐标密度;将坐标密度最大的区间作为坐标密集区域。进一步地,根据各区间的坐标密度识别出坐标密集区域包括:根据各区间对应的坐标数量确定各区间的坐标密度;若坐标密度最大的区间包含预定区域内的预定比例的坐标点,则将坐标密度最大的区间作为坐标密集区域。进一步地,该方法还包括:递归获取与坐标密度最大的区间的相邻区间中坐标密度最大的区间;判断预定区域内的预定比例的坐标点是否在预定面积范围内;若预定区域内的预定比例的坐标点在预定面积范围内,则将坐标密度最大的区间与相邻区间中坐标密度最大的区间的集合作为坐标密集区域。进一步地,该方法还包括:对预定区域内地址数据对应的经纬度坐标进行预处理,去除无效经纬度坐标。进一步地,该方法还包括:基于MapReduce编程架构对预定区域内地址数据进行处理。根据本专利技术的另一实施例,还提出一种地址数据处理装置,包括:地址数据坐标获取单元,用于获取预定区域内地址数据对应的经纬度坐标;区域划分单元,用于根据预定区域内地址数据对应的经纬度坐标将预定区域分为多个区间;坐标密集区域确定单元,用于根据各区间的坐标密度识别出坐标密集区域;标准地址坐标确定单元,用于将坐标密集区域内的坐标作为标准地址坐标。进一步地,该装置还包括标准地址存储单元,标准地址存储单元用于将坐标密集区域内的坐标按照标准地址库的结构进行存储。进一步地,该装置还包括经纬度极值确定单元,经纬度极值确定单元用于确定预定区域内地址数据对应的经度最大值和最小值以及纬度最大值和最小值;其中,区域划分单元用于将经度最大值和最小值以及纬度最大值和最小值构成的区域等分为多个区间。进一步地,该装置还包括区间坐标密度确定单元,区间坐标密度确定单元用于根据各区间对应的坐标数量确定各区间的坐标密度;其中,坐标密集区域确定单元用于将坐标密度最大的区间作为坐标密集区域。进一步地,该装置还包括区间坐标密度确定单元,区间坐标密度确定单元用于根据各区间对应的坐标数量确定各区间的坐标密度;坐标密集区域确定单元还用于若坐标密度最大的区间包含预定区域内的预定比例的坐标点,则将坐标密度最大的区间作为坐标密集区域。进一步地,该装置还包括区间集合确定单元,区间集合确定单元用于递归获取与坐标密度最大的区间相邻区间中坐标密度最大的区间;其中,坐标密集区域确定单元还用于若预定区域内的预定比例的坐标点在预定面积范围内,则将坐标密度最大的区间与相邻区间中坐标密度最大的区间的集合作为坐标密集区域。进一步地,该装置还包括坐标预处理单元,坐标预处理单元用于对预定区域内地址数据对应的经纬度坐标进行预处理,去除无效经纬度坐标。进一步地,地址数据坐标获取单元、坐标密集区域确定单元和标准地址坐标确定单元基于MapReduce编程架构对预定区域内地址数据进行处理。根据本专利技术的再一实施例,还提出一种地址数据处理装置,包括:存储器;以及耦接至存储器的处理器,处理器被配置为基于存储在存储器的指令执行如上述的方法。根据本专利技术的又一实施例,还提出一种计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现上述的方法的步骤。与现有技术相比,本专利技术实施例获取预定区域内地址数据对应的经纬度坐标后,根据预定区域内地址数据对应的经纬度坐标将预定区域分为多个区间,根据各区间的坐标密度识别出坐标密集区域,并将坐标密集区域内的坐标作为标准地址坐标,使得在筛选地址和坐标时更加准确、快速,能更好的为地址服务提供数据基础。通过以下参照附图对本专利技术的示例性实施例的详细描述,本专利技术的其它特征及其优点将会变得清楚。附图说明构成说明书的一部分的附图描述了本专利技术的实施例,并且连同说明书一起用于解释本专利技术的原理。参照附图,根据下面的详细描述,可以更加清楚地理解本专利技术,其中:图1为本专利技术地址数据处理方法的一个实施例的流程示意图。图2为本专利技术地址数据处理方法的另一个实施例的流程示意图。图3为本专利技术地址数据处理方法的再一个实施例的流程示意图。图4为本专利技术地址数据处理方法的又一个实施例的流程示意图。图5为本专利技术地址数据处理方法的一个具体实施例的流程示意图。图6为本专利技术地址数据处理装置的一个实施例的结构示意图。图7为本专利技术地址数据处理装置的另一个实施例的结构示意图。图8为本专利技术地址数据处理装置的再一个实施例的结构示意图。图9为本专利技术地址数据处理装置的又一个实施例的结构示意图。图10为本专利技术地址数据处理装置的又一个实施例的结构示意图。具体实施方式现在将参照附图来详细描述本专利技术的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本专利技术的范围。同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本专利技术及其应用或使用的任何限制。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本专利技术进一步详细说明。图1为本专利技术地址数据处理方法的一个实施例的流程示意图。该方法包括以下步骤:在步骤110,获取预定区域内地址数据对应的经纬度坐标。例如,获取某一街道的订单妥投地址以本文档来自技高网...
地址数据处理方法和装置

【技术保护点】
一种地址数据处理方法,包括:获取预定区域内地址数据对应的经纬度坐标;根据所述预定区域内地址数据对应的经纬度坐标将所述预定区域分为多个区间;根据各区间的坐标密度识别出坐标密集区域;将所述坐标密集区域内的坐标作为标准地址坐标。

【技术特征摘要】
1.一种地址数据处理方法,包括:获取预定区域内地址数据对应的经纬度坐标;根据所述预定区域内地址数据对应的经纬度坐标将所述预定区域分为多个区间;根据各区间的坐标密度识别出坐标密集区域;将所述坐标密集区域内的坐标作为标准地址坐标。2.根据权利要求1所述的方法,还包括:将所述坐标密集区域内的坐标按照标准地址库的结构进行存储。3.根据权利要求2所述的方法,根据所述预定区域内地址数据对应的经纬度坐标将所述预定区域分为多个区间包括:确定所述预定区域内地址数据对应的经度最大值和最小值以及纬度最大值和最小值;将所述经度最大值和最小值以及所述纬度最大值和最小值构成的区域等分为多个区间。4.根据权利要求3所述的方法,根据各区间的坐标密度识别出坐标密集区域包括:根据各区间对应的坐标数量确定各区间的坐标密度;将坐标密度最大的区间作为坐标密集区域。5.根据权利要求3所述的方法,根据各区间的坐标密度识别出坐标密集区域包括:根据各区间对应的坐标数量确定各区间的坐标密度;若坐标密度最大的区间包含所述预定区域内的预定比例的坐标点,则将所述坐标密度最大的区间作为坐标密集区域。6.根据权利要求4或5所述的方法,还包括:递归获取与所述坐标密度最大的区间的相邻区间中坐标密度最大的区间;判断所述预定区域内的预定比例的坐标点是否在预定面积范围内;若所述预定区域内的预定比例的坐标点在预定面积范围内,则将所述坐标密度最大的区间与相邻区间中坐标密度最大的区间的集合作为坐标密集区域。7.根据权利要求1-5任一所述的方法,还包括:对所述预定区域内地址数据对应的经纬度坐标进行预处理,去除无效经纬度坐标。8.根据权利要求1-5任一所述的方法,还包括:基于MapReduce编程架构对所述预定区域内地址数据进行处理。9.一种地址数据处理装置,包括:地址数据坐标获取单元,用于获取预定区域内地址数据对应的经纬度坐标;区域划分单元,用于根据所述预定区域内地址数据对应的经纬度坐标将所述预定区域分为多个区间;坐标密集区域确定单元,用于根据各区间的坐标密度识别出坐标密集区域;标准地址坐标确定单元,用于将所述坐标密集区域内的坐标作为标准地址坐标。10.根据...

【专利技术属性】
技术研发人员:龙准
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1