【技术实现步骤摘要】
基于模糊匹配的地址标准化方法、系统、设备及介质
本专利技术涉及意图标签筛选
,特别涉及一种基于模糊匹配的地址标准化方法、系统、设备及介质。
技术介绍
随着电商、外卖、上门生活服务等平台的崛起,地址缺失、地址错误等层出不穷,地址如何修正并标准化是企业急需解决的问题之一。一般地,企业地址标准化存在以下几个问题:1)地址数据分散,人工关联分析效率低、效果差。2)企业内部与外部均存在数据孤岛问题。3)地址缺失、地址异常等问题较难识别、分析。
技术实现思路
为解决上述技术问题,本专利技术提供了一种基于模糊匹配的地址标准化方法、系统、设备及介质。本专利技术一方面提供了一种基于模糊匹配的地址标准化方法,所述基于模糊匹配的地址标准化方法包括:接收用户定位请求并从用户定位请求中获取地址参数;调用高德API及本地标准化ES库,获取与所述地址参数相似度较高的预设数量的地址节点;计算各所述地址节点与所述地址参数对应经纬度的距离偏移值;选取所述距离偏移值中最小值 ...
【技术保护点】
1.一种基于模糊匹配的地址标准化方法,其特征在于,所述方法包括:/n接收用户定位请求并从用户定位请求中获取地址参数;/n调用高德API及本地标准化ES库,获取与所述地址参数相似度较高的预设数量的地址节点;/n计算各所述地址节点与所述地址参数对应经纬度的距离偏移值;/n选取所述距离偏移值中最小值对应的地址节点作为真实地址并返回给用户。/n
【技术特征摘要】
1.一种基于模糊匹配的地址标准化方法,其特征在于,所述方法包括:
接收用户定位请求并从用户定位请求中获取地址参数;
调用高德API及本地标准化ES库,获取与所述地址参数相似度较高的预设数量的地址节点;
计算各所述地址节点与所述地址参数对应经纬度的距离偏移值;
选取所述距离偏移值中最小值对应的地址节点作为真实地址并返回给用户。
2.根据权利要求1所述的方法,其特征在于,所述调用高德API及本地标准化ES库,获取与所述地址参数相似度较高的预设数量的地址节点,包括:
调用高德开放平台地址编码API,获取所述地址参数所属的行政区划编码、经纬度及地址等级;
判断所述地址等级对应字段是否为省、市、区县或未知;
如所述地址等级对应字段不为省、市、区县及未知中的任一种,利用所述行政区划编码在所述ES地址库中搜索预设数量的与所述地址参数匹配度较高的地址节点。
3.根据权利要求1或2所述的方法,其特征在于,所述调用高德API及本地标准化ES库,获取与所述地址参数相似度较高的预设数量的地址节点,还包括利用中文分词法获取与所述地址参数相似度较高的预设数量的地址节点,具体包括:
解析所述地址参数以获取所述地址参数对应的行政区划,所述行政区划包括省、直辖市、市、区县和详细地址部分中的至少一种;
根据所述行政区划查找对应的省市区内地址节点,通过中文分词将详细地址与ES地址库中的数据进行匹配,计算文本相似度;
选取文本相似度较高的预设数量的地址节点。
4.根据权利要求3所述的方法,其特征在于,如所述地址等级对应字段为省、市、区县及未知中的任一种时,利用所述中文分词法获取与所述地址参数相似度较高的预设数量的地址节点。
5.一种基于模糊匹配的地址标准化系统,其特征在于,所述系统包括:
数据接收单元,用于接收用户定位请求并从用户定位请...
【专利技术属性】
技术研发人员:崔晶晶,张建东,
申请(专利权)人:集奥聚合北京人工智能科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。