地址解析方法技术

技术编号:39677698 阅读:18 留言:0更新日期:2023-12-11 18:55
本申请提供了地址解析方法

【技术实现步骤摘要】
地址解析方法、装置、计算机设备及计算机可读存储介质


[0001]本申请涉及信息
,尤其涉及一种地址解析方法

装置

计算机设备及计算机可读存储介质


技术介绍

[0002]随着移动互联网和信息技术的发展,人们的生活方式发生了大的改变,如电商

物流

出行等,无不与信息技术进行了完美的结合

[0003]同时一种新的货运方式也出现了,用户通过在线
APP
下单,货运司机在应用程序
(APP)
上接单,然后司机

用户通过
APP
的导航线下碰面,最终完成装货

运货

卸货

[0004]在下单过程中,用户会在
APP
上选择一个兴趣点
(Point ofInterest POI)
,并填写地址备注信息
(
如写明2号楼2单元
)。
如何有效地对用户填写的地址备注信息进行解析,是得到用户详细的意图地址的关键,决定着后续的整个流程

如果不解析或解析不正确,将极大地影响用户体验

然而,目前的解析用户地址的方法,均通过兴趣点名称文本相似度进行检索,存在解析不够准确或解析不到的情况

[0005]针对现存方法存在的问题,急需提供一种准确

全面的地址解析的方法r/>、
装置

计算机设备及计算机可读存储介质


技术实现思路

[0006]本申请的目的在于提供一种准确

全面的地址解析方法

装置

计算机设备及存储介质,旨在解决上述技术问题之一

[0007]第一方面,一种地址解析方法,包括:
[0008]设置第一区域范围和第二区域范围;
[0009]获取用户选取的兴趣点和填写的地址备注信息;
[0010]将所述兴趣点和所述地址备注信息合并成待获取地址;
[0011]在用户选取的所述兴趣点的第一区域范围内根据所述待获取地址检索获得名称相同或相近的兴趣点;
[0012]在用户选取的所述兴趣点的第二区域范围内根据所述待获取地址检索出所有兴趣点;
[0013]将检索出的所有所述兴趣点与所述待获取地址进行相似度计算获得目标兴趣点

[0014]优选地,上述获取用户选取的兴趣点和填写的地址备注信息的步骤之后还包括:过滤所述地址备注信息的步骤;
[0015]所述过滤所述地址备注信息具体为:
[0016]获取历史地址备注信息;
[0017]建立
BERT
模型;
[0018]用所述历史地址备注信息训练所述
BERT
模型;
[0019]输入所述地址备注信息,通过训练后的所述
BERT
模型去除用户填写的无用信息

[0020]优选地,上述将所述兴趣点和所述地址备注信息合并成待获取地址具体为:
[0021]分别对所述兴趣点和所述地址备注信息进行切词;
[0022]对切词后的所述兴趣点和所述地址备注信息进行规范化;
[0023]去除所述兴趣点和所述地址备注信息重复的词语;
[0024]将去除重复词语的所述兴趣点和所述地址备注信息合并成待获取地址

[0025]优选地,上述在用户选取的所述兴趣点的第二区域范围内根据所述待获取地址检索出所有兴趣点之后还包括:对检索出的所有所述兴趣点进行初步筛选的步骤;
[0026]所述对检索出的所有所述兴趣点进行初步筛选具体为:
[0027]将检索出的所述兴趣点和所述待获取地址进行字符比较获取最长公共子串;
[0028]判断所述最长公共子串是否大于2:如果不大于2,删除所述兴趣点;
[0029]如果大于2,将检索出的所述兴趣点和所述待获取地址进行交并比计算;
[0030]对检索出的所述兴趣点根据所述交并比计算结果按高到低顺序排序;
[0031]初步筛选出排名前
30
的所述兴趣点

[0032]优选地,上述将检索出的所有所述兴趣点与所述待获取地址进行相似度计算获得目标兴趣点具体为:
[0033]设置高阈值;
[0034]设置小于所述高阈值的低阈值;
[0035]对检索出的所有所述兴趣点和所述待获取地址分别进行切词;
[0036]检索出的所有所述兴趣点按切词后的各词语分别进行
TF

IDF
向量化计算获得第一维度值;
[0037]各所述兴趣点的所有所述第一维度值分别拼接后获得第一向量值
V
a

[0038]所述待获取地址按切词后的各词语分别进行
TF

IDF
向量化计算获得第二维度值;
[0039]所述待获取地址的所有所述第二纬度值拼接后获得第二向量值
V
b

[0040]获取用户选取的所述兴趣点的坐标;
[0041]获取检索出的所有所述兴趣点的坐标;
[0042]分别计算检索出的各所述兴趣点的坐标和用户选取的所述兴趣点的坐标的物理距离
distance(a,b)

[0043]用余弦公式计算获得检索出的各所述兴趣点的余弦相似度;
[0044]判断所述余弦相似度是否大于所述高阈值,如果大于所述高阈值,选取所述兴趣点作为目标兴趣点;如果不大于所述高阈值,判断所述余弦相似度是否大于所述低阈值:如果大于所述低阈值,进一步判断所述待获取地址与检索出的所述兴趣点名称是否存在包含关系,如果存在包含关系,选取所述兴趣点作为目标兴趣点;
[0045]所述余弦公式为:
|V
a
|
是向量
V
a
的模,
|V
b
|
是向量
V
b
的模

[0046]另一优选地,上述将检索出的所有所述兴趣点与所述待获取地址进行相似度计算获得目标兴趣点具体为:
[0047]设置高阈值;
[0048]设置小于所述高阈值的低阈值;
[0049]对检索出的所有所述兴趣点和所述待获取地址分别进行切词;
[0050]检索出的所有所述兴趣点按切词后的各词语分别进行
TF

IDF
向量化计算获得第一维度值;
[0051]各所述兴趣点的所有所述第一维度值分别拼接后获得第一向量值
V
a

[0052]所述待获取地址按切词后的各词语本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种地址解析方法,其特征在于,包括:设置第一区域范围和第二区域范围;获取用户选取的兴趣点和填写的地址备注信息;将所述兴趣点和所述地址备注信息合并成待获取地址;在用户选取的所述兴趣点的第一区域范围内根据所述待获取地址检索获得名称相同或相近的兴趣点;在用户选取的所述兴趣点的第二区域范围内根据所述待获取地址检索出所有兴趣点;将检索出的所有所述兴趣点与所述待获取地址进行相似度计算获得目标兴趣点
。2.
如权利要求1所述的地址解析方法,其特征在于,所述获取用户选取的兴趣点和填写的地址备注信息的步骤之后还包括:过滤所述地址备注信息的步骤;所述过滤所述地址备注信息具体为:获取历史地址备注信息;建立
BERT
模型;用所述历史地址备注信息训练所述
BERT
模型;输入所述地址备注信息,通过训练后的所述
BERT
模型去除用户填写的无用信息
。3.
如权利要求2所述的地址解析方法,其特征在于,所述将所述兴趣点和所述地址备注信息合并成待获取地址具体为:分别对所述兴趣点和所述地址备注信息进行切词;对切词后的所述兴趣点和所述地址备注信息进行规范化;去除所述兴趣点和所述地址备注信息重复的词语;将去除重复词语的所述兴趣点和所述地址备注信息合并成待获取地址
。4.
如权利要求3所述的地址解析方法,其特征在于,所述在用户选取的所述兴趣点的第二区域范围内根据所述待获取地址检索出所有兴趣点之后还包括:对检索出的所有所述兴趣点进行初步筛选的步骤;所述对检索出的所有所述兴趣点进行初步筛选具体为:将检索出的所述兴趣点和所述待获取地址进行字符比较获取最长公共子串;判断所述最长公共子串是否大于2:如果不大于2,删除所述兴趣点;如果大于2,将检索出的所述兴趣点和所述待获取地址进行交并比计算;对检索出的所述兴趣点根据所述交并比计算结果按高到低顺序排序;初步筛选出排名前
30
的所述兴趣点
。5.
如权利要求4所述的地址解析方法,其特征在于,所述将检索出的所有所述兴趣点与所述待获取地址进行相似度计算获得目标兴趣点具体为:设置高阈值;设置小于所述高阈值的低阈值;对检索出的所有所述兴趣点和所述待获取地址分别进行切词;检索出的所有所述兴趣点按切词后的各词语分别进行
TF

IDF
向量化计算获得第一维度值;
各所述兴趣点的所有所述第一维度值分别拼接后获得第一向量值
V
a
;所述待获取地址按切词后的各词语分别进行
TF

IDF
向量化计算获得第二维度值;所述待获取地址的所有所述第二纬度值拼接后获得第二向量值
V
b
;获取用户选取的所述兴趣点的坐标;获取检索出的所有所述兴趣点的坐标;分别计算检索出的各所述兴趣点的坐标和用户选取的所述兴趣点的坐标的物理距离
distance(a,b)
;用余弦公式计算获得检索出的各所述兴趣点的余弦相似度;判断所述余弦相似度是否大于所述高阈值,如果大于所述高阈值,选取所述兴趣点作为目标兴趣点;如果不大于所述高阈值,判断所述余弦相似度是否大于所述低阈值:如果大于所述低阈值,进一步判断所述待获取地址与检索出的所述兴趣点名称是否存在包含关系,如果存在包含关系,选取所述兴趣点作为目标兴趣点;所述余弦公式为:
|V
a
|
是向量
V
a
的模,
|V
b
|
是向量
V
b
的模
。6.
如权利要求4所述的地址解析方法,其特征在于,所述将检索出的所有所述兴趣点与所述待获取地址进行相似度计算获得目标兴趣点具体为:设置高阈值;设置小于所述高阈值的低阈值;对检索出的所有所述兴趣点和所述待获取地址分别进行切词;检索出的所有所述兴趣点按切词后的各词语分别进行
TF

IDF
向量化计算获得第一维度值;各所述兴趣点的所有所述第一维度值分别拼接后获得第一向量值
V
a
;所述待获取地址按切词后的各词语分别进...

【专利技术属性】
技术研发人员:白晓明武东旭王新乐
申请(专利权)人:深圳依时货拉拉科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1