【技术实现步骤摘要】
地址定位、地址监测、信息处理方法及装置
本申请涉及定位搜索
,特别是涉及一种地址定位、地址监测、信息处理方法及装置。
技术介绍
随着路线导航、物流配送等行业的迅猛发展,定位搜索技术的应用也越来越广泛。为了便于路线导航和物流配送,以及基于用户的所处的地址坐标进行其它的数据分析和应用,通常需要将海量用户填写的、个性化的各种文字地址描述转换为用经度和纬度描述的具体地址坐标,因此,需要一种地址定位方法。现有技术中,可以接收用户提交的目标地址,通过剔除噪音、更改格式和纠正拼写等方式对该目标地址进行规范化处理,通过调用地址元素词典数据库,将规划处处理后的目标地址分解为多个地址元素,查找与该多个地址元素对应的地址坐标,从而完成地址定位。由于需要通过调用地址元素词典数据库才能完成地址定位,该地址元素词典数据库通常是通过人工收集得到的。一方面,由于用户提交的目标地址可能千变万化,而不同的经度和纬度也可以有无限种组合,另一方面,通过人工收集得到这两个数据库的效率也相当有限。因此,该地址元素词典数据库所收集的地址元素的数目通常有限,这会导致可能无法对某些目标地址进行分解,进而导致 ...
【技术保护点】
1.一种地址定位方法,其特征在于,包括:从目标地址中提取多个字符组合;确定所述多个字符组合作为地址元素的元素属性;根据字符组合的元素属性将所述目标地址分解为多个地址元素;基于所述多个地址元素进行地址定位。
【技术特征摘要】
1.一种地址定位方法,其特征在于,包括:从目标地址中提取多个字符组合;确定所述多个字符组合作为地址元素的元素属性;根据字符组合的元素属性将所述目标地址分解为多个地址元素;基于所述多个地址元素进行地址定位。2.根据权利要求1所述的地址定位方法,其特征在于,所述元素属性包括组合概率,所述确定所述多个字符组合作为地址元素的元素属性包括:将所述字符组合与所述目标地址内相邻于所述字符组合的至少一个其它字符组成父字符组合;确定所述字符组合在地址集合中的第一统计数据和各父字符组合在所述地址集合中的第二统计数据;根据所述第一统计数据和第二统计数据,确定所述字符组合的组合概率,所述组合概率与所述第一统计数据成负向关系,且与所述第二统计数据成正向关系。3.根据权利要求2所述的地址定位方法,其特征在于,所述根据字符组合的元素属性将所述目标地址分解为多个地址元素包括:如果所述组合概率处于预设组合概率范围,则以所述字符组合为地址元素对所述目标地址进行拆分。4.根据权利要求1所述的地址定位方法,其特征在于,所述元素属性包括分解概率,所述确定所述多个字符组合作为地址元素的元素属性包括:将所述字符组合的子字符组合与至少一个其它字符组成父字符组合;确定所述字符组合在地址集合中的第一统计数据和除所述字符组合外的各父字符组合在地址集合中的第三统计数据;根据所述第一统计数据和所述第三统计数据,确定所述字符组合的分解概率,所述分解概率与所述第一统计数据成负向关系。5.根据权利要求4所述的地址定位方法,其特征在于,所述根据字符组合的元素属性将所述目标地址分解为多个地址元素包括:如果所述分解概率处于预设分解概率范围,则以所述字符组合为地址元素对所述目标地址进行拆分。6.根据权利要求1所述的地址定位方法,其特征在于,所述元素属性包括组合概率和分解概率,所述根据字符组合的元素属性将所述目标地址分解为多个地址元素包括:对于各字符组合,如果所述字符组合的组合概率处于预设组合概率范围且所述字符组合的分解概率处于预设分解概率范围,则以所述字符组合为地址元素对所述目标地址进行拆分。7.根据权利要求1所述的地址定位方法,其特征在于,所述从目标地址中提取多个字符组合包括:按照设定的字符拆分规则将所述目标地址拆分为多个字符;按照设定的字符组合规则将所述多个字符组合为所述多个字符组合。8.根据权利要求1所述的地址定位方法,其特征在于,所述根据字符组合的元素属性将所述目标地址分解为多个地址元素包括:判定所述目标地址中除地址元素之外还包括至少一个字符;以各地址元素为字符,重新提取字符组合,并根据新提取的字符组合的元素属性再次分解所述目标地址,并迭代执行直至所述目标地址中不存在可组合至地址元素的字符。9.根据权利要求8所述的地址定位方法,其特征在于,在所述根据字符组合的元素属性将所述目标地址分解为多个地址元素之后,还包括:从所述目标地址中删除地址元素之外的字符。10.根据权利要求1所述的地址定位方法,其特征在于,所述基于所述多个地址元素进行地址定位包括:根据预先收集的样本地址与定位数据的关联关系,确定与所述多个地址元素对应的定位数据。11.根据权利要求10所述的地址定位方法,其特征在于,所述根据预先收集的样本地址与定位数据的关联关系,确定与所述多个地址元素对应的定位数据包括:查找与所述多个地址元素匹配的样本地址;根据所述样本地址对应的定位数据,确定与所述多个地址元素对应的定位数据。12.根据权利要求11所述的地址定位方法,其特征在于,所述查找与所述多个地址元素匹配的样本地址包括:查找包括所述多个地址元素的第一样本地址,和/或查找部分包括所述多个地址元素的第二样本地址。13.根据权利要求12所述的地址定位方法,其特征在于,在基于所述多个地址元素进行地址定位之前,还包括:按照与各地址元素对应的编号,生成与所述目标地址对应的地址编码;所述查找包括所述多个地址元素的第一样本地址,和/或查找部分包括所述多个地址元素的第二样本地址包括:查找与所述目标地址对应相同的地址编码的样本地址作为所述第一样本地址,和/或查找与所述目标地址部分对应相同的地址编码的样本地址作为所述第二样本地址。14.根据权利要求12所述的地址定位方法,其特征在于,当存在所述第一地址样本和所述第二样本地址时,所述根据所述样本地址对应的定位数据,确定与所述多个地址元素对应的定位数据包括:以所述第一地址样本和所述第二...
【专利技术属性】
技术研发人员:刘永凯,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。