地址区划分类方法、系统、设备及存储介质技术方案

技术编号:28558726 阅读:20 留言:0更新日期:2021-05-25 17:53
本发明专利技术提供了一种地址区划分类方法、系统、设备及存储介质,该方法包括:获取用户输入的地址数据;根据预设的信息提取规则,确定所述地址数据中需要提取的地址元素,从所述地址数据中提取输入地址文本;提取所述输入地址文本的地址特征向量,并输入区划预测模型,所述区划预测模型配置为基于所述地址特征向量进行区划分类;获取所述区域预测模型输出的区划分类结果。本发明专利技术将区划分类转换为文本分类问题,实现了行政区划的准确预测,以填补收货地址中缺失的信息或对部分信息进行纠正。

【技术实现步骤摘要】
地址区划分类方法、系统、设备及存储介质
本专利技术涉及物流数据处理
,尤其涉及一种地址区划分类方法、系统、设备及存储介质。
技术介绍
物流场景下,用户所填收货地址存在如下现象:行政区划与地址详情不对应;多套行政区划,即用户下拉控件选择一套,地址详情填写一套,两套区划可能不一一致;行政区划缺失,如区县选择“其他区”。用户收货地址行政区划错误或缺失会影响物流一段码计算,导致用户包裹无无法正常流转,用户无法及时收到包裹,最终造成用户购物体验损害。此外,存在其他物流场景同样依赖用户地址行政区划信息,例如,快递公司根据收货地址行政区划进行物流费用计价;电商/快递公司利用行政区划圈定仓库配送区域范围等。在这些物流场景下,如果用户收货地址行政区划错误或缺失,会影响对应业务的正常实现。
技术实现思路
针对现有技术中的问题,本专利技术的目的在于提供一种地址区划分类方法、系统、设备及存储介质,将区划分类转换为文本分类问题,实现行政区划的准确预测,以填补收货地址中缺失的信息或对部分信息进行纠正。本专利技术实施例提供一种地址区划分类方法,包括如下步骤:获取用户输入的地址数据;根据预设的信息提取规则,确定所述地址数据中需要提取的地址元素,从所述地址数据中提取输入地址文本;提取所述输入地址文本的地址特征向量,并输入区划预测模型,所述区划预测模型配置为基于所述地址特征向量进行区划分类;获取所述区域预测模型输出的区划分类结果。在一些实施例中,所述获取用户输入的地址数据,包括:提供地址输入页面给用户,所述地址输入页面包括区划选择部分和详细地址输入部分;获取用户在所述区划选择部分选择的区划信息;以及获取用户在所述详细地址输入部分输入的详细地址信息。在一些实施例中,所述信息提取规则包括对地址数据中各个地址元素的提取规则;根据预设的信息提取规则,确定所述地址数据中需要提取的地址元素,从所述地址数据中提取输入地址文本,包括如下步骤:将所述地址数据拆分为多个地址元素,确定各个地址元素的类别;根据预设的各个地址元素的类别与区划分类结果的关联关系,确定是否需要提取该地址元素;将确定需要提取的地址元素从所述地址数据中提取出来,得到输入地址文本。在一些实施例中,所述训练好的区划预测模型包括多个区划预测模型,所述区划预测模型分别对应于第一种级别的区划类型,所述区划分类结果包括第二种级别的区划类型,所述第一种级别高于所述第二种级别。在一些实施例中,所述第一种级别的区划类型为地级行政区,所述第二种级别的区划类型为县级行政区。在一些实施例中,所述输入区划预测模型,包括如下步骤:确定所述地址数据中的第一种级别的区划类型;根据确定的第一种级别的区划类型选择对应的区划预测模型;将所述地址数据输入所对应的区划预测模型。在一些实施例中,还包括采用如下步骤训练所述区划预测模型:对于各个第一种级别的区划类型,获取所对应的样本地址文本;分别为所述样本地址文本添加第二种级别的分类标签后,加入所对应的第一种级别的训练集;采用所述训练集训练所对应的区划预测模型。在一些实施例中,所述训练所对应的区划预测模型,包括如下步骤:对于每轮训练,根据所述区划预测模型输出的区划分类结果和所对应的分类标签计算评估指标;基于所述评估指标优化训练所述区划预测模型。在一些实施例中,所述区划预测模型为支持向量机模型,所述评估指标包括精准率和命中率。在一些实施例中,所述对于各个第一种级别的区划类型,获取所对应的样本地址文本,包括如下步骤:对于各个第一种级别的区划类型,确定其所包括的各个第二种级别的区划类型;采集各个第一种级别的区划类型对应的多个样本地址文本,所述样本地址文本包括各个所述第二种级别的区划类型对应的样本地址文本。在一些实施例中,所述采集各个第一种级别对应的多个样本地址文本之后,还包括如下步骤:基于预设的地址变化规则,对采集的多个样本地址文本中至少部分文本进行变化,得到变化地址信息;为所述变化地址信息添加第二种级别的分类标签后,加入所对应的训练集中。在一些实施例中,所述对于各个第一种级别的区划类型,获取所对应的样本地址文本,包括如下步骤:对于各个第一种级别的区划类型,采集样本地址数据,提取所述样本地址数据中的地址元素,并确定所述地址元素的类别;确定所述地址元素的类别与第二种级别的分类标签的关联关系;根据所述关联关系确定所述样本地址数据中需要提取的地址元素,从所述样本地址数据中提取样本地址文本。在一些实施例中,获取所述区划预测模型输出的区划分类结果,作为所述地址数据所对应的第二种级别的区划类型之后,还包括如下步骤:判断所述用户输入的地址数据中是否存在与所述区划分类结果同级别的区划信息;如果不存在,则将所述区划分类结果添加到所述地址数据中。在一些实施例中,判断所述用户输入的地址数据中是否存在与所述区划分类结果同级别的区划信息之后,还包括如下步骤;如果存在,则比较所述地址数据中同级别的区划信息和所述区划分类结果是否一致;如果不一致,则将所述地址数据中同级别的区划信息替换为所述区划分类结果。本专利技术实施例还提供一种地址区划分类系统,应用于所述的地址区划分类方法,所述系统包括:数据获取模块,用于获取用户输入的地址数据;文本提取模块,用于根据预设的信息提取规则,确定所述地址数据中需要提取的地址元素,从所述地址数据中提取输入地址文本;模型输入模块,用于提取所述输入地址文本的地址特征向量,并输入区划预测模型,所述区划预测模型配置为基于所述地址特征向量进行区划分类;区划分类模块,用于获取所述区域预测模型输出的区划分类结果。本专利技术实施例还提供一种地址区划分类设备,包括:处理器;存储器,其中存储有所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行所述的地址区划分类方法的步骤。本专利技术实施例还提供一种计算机可读存储介质,用于存储程序,所述程序被处理器执行时实现所述的地址区划分类方法的步骤。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。本专利技术的地址区划分类方法、系统、设备及存储介质具有如下有益效果:本专利技术将区划分类转换为文本分类问题,通过对地址数据进行输入地址文本提取和文本的地址特征向量提取,并将地址特征向量输入到训练好的区划预测模型,实现了行政区划的准确和快速预测分类,以填补收货地址中缺失的信息或对部分信息进行纠正,能够有效提高提高物流公司和电商平台物流履约服务质量,有利于改善用户使用体验。附图说明通过阅读参照以下附图对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显。图1是本专利技术一实施例的地址本文档来自技高网...

【技术保护点】
1.一种地址区划预测方法,其特征在于,所述方法包括:/n获取用户输入的地址数据;/n根据预设的信息提取规则,确定所述地址数据中需要提取的地址元素,从所述地址数据中提取输入地址文本;/n提取所述输入地址文本的地址特征向量,并输入区划预测模型,所述区划预测模型配置为基于所述地址特征向量进行区划分类;/n获取所述区域预测模型输出的区划分类结果。/n

【技术特征摘要】
1.一种地址区划预测方法,其特征在于,所述方法包括:
获取用户输入的地址数据;
根据预设的信息提取规则,确定所述地址数据中需要提取的地址元素,从所述地址数据中提取输入地址文本;
提取所述输入地址文本的地址特征向量,并输入区划预测模型,所述区划预测模型配置为基于所述地址特征向量进行区划分类;
获取所述区域预测模型输出的区划分类结果。


2.根据权利要求1所述的地址区划分类方法,其特征在于,所述获取用户输入的地址数据,包括:
提供地址输入页面给用户,所述地址输入页面包括区划选择部分和详细地址输入部分;
获取用户在所述区划选择部分选择的区划信息;以及获取用户在所述详细地址输入部分输入的详细地址信息。


3.根据权利要求1所述的地址区划分类方法,其特征在于,所述信息提取规则包括对地址数据中各个地址元素的提取规则;
根据预设的信息提取规则,确定所述地址数据中需要提取的地址元素,从所述地址数据中提取输入地址文本,包括如下步骤:
将所述地址数据拆分为多个地址元素,确定各个地址元素的类别;
根据预设的各个地址元素的类别与区划分类结果的关联关系,确定是否需要提取该地址元素;
将确定需要提取的地址元素从所述地址数据中提取出来,得到输入地址文本。


4.根据权利要求1所述的地址区划分类方法,其特征在于,所述训练好的区划预测模型包括多个区划预测模型,所述区划预测模型分别对应于第一种级别的区划类型,所述区划分类结果包括第二种级别的区划类型,所述第一种级别高于所述第二种级别。


5.根据权利要求4所述的地址区划分类方法,其特征在于,所述第一种级别的区划类型为地级行政区,所述第二种级别的区划类型为县级行政区。


6.根据权利要求4所述的地址区划分类方法,其特征在于,所述输入区划预测模型,包括如下步骤:
确定所述地址数据中的第一种级别的区划类型;
根据确定的第一种级别的区划类型选择对应的区划预测模型;
将所述地址数据输入所对应的区划预测模型。


7.根据权利要求4所述的地址区划分类方法,其特征在于,还包括采用如下步骤训练所述区划预测模型:
对于各个第一种级别的区划类型,获取所对应的样本地址文本;
分别为所述样本地址文本添加第二种级别的分类标签后,加入所对应的第一种级别的训练集;
采用所述训练集训练所对应的区划预测模型。


8.根据权利要求7所述的地址区划分类方法,其特征在于,所述训练所对应的区划预测模型,包括如下步骤:
对于每轮训练,根据所述区划预测模型输出的区划分类结果和所对应的分类标签计算评估指标;
基于所述评估指标优化训练所述区划预测模型。


9.根据权利要求8所述的地址区划分类方法,其特征在于,所述区划预测模型为支持向量机模型,所述评估指标包括精准率和命中率。


10.根据权利要求7所述的地址区划分...

【专利技术属性】
技术研发人员:刘成亮周筠
申请(专利权)人:上海寻梦信息技术有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1