中文地址检测方法及其装置、设备、介质、产品制造方法及图纸

技术编号:33351699 阅读:35 留言:0更新日期:2022-05-08 09:58
本申请公开一种中文地址检测方法及其装置、设备、介质、产品,所述方法包括:获取客户端设备提交的中文的地址信息,根据地址信息生成初始地址文本;按照预设步长以固定窗口滑动提取所述初始地址文本获得多个分词,以构成初始地址文本的地址特征;计算所述初始地址文本的地址特征与为目标地区预设的枚举地址库中的中文的枚举地址的地址特征之间的编辑距离,确定其中编辑距离最小的枚举地址为推荐地址文本;向所述客户端设备推送包含所述推荐地址文本的通知消息。本申请的技术方案能够提升电商订单中的地址信息识别的准确率,引导用户修正错误的地址信息,提升电商订单执行效率。提升电商订单执行效率。提升电商订单执行效率。

【技术实现步骤摘要】
中文地址检测方法及其装置、设备、介质、产品


[0001]本申请涉及电商信息处理
,尤其涉及一种中文地址检测方法及其相应的装置、计算机设备、计算机可读存储介质,以及计算机程序产品。

技术介绍

[0002]物流服务体系在电商领域中特别重要。物流服务是从接收顾客订单开始到将商品送到顾客手中为止所发生的所有服务活动,可使交易的产品或服务实现增值。其本质是更好地满足顾客需求,即保证顾客需要的商品在顾客要求的时间内准时送达,服务能达到顾客所要求的水平等。
[0003]在电商领域的物流服务平台中,物流服务根据用户提供的地址文本进行识别提取,并规整输出各个行政层级相对应的地名,以便协助实现商品的物流送达。
[0004]现实中,由于用户习惯以及部分非平台订单缺少地址校验机制等原因,用户留下来的地址存在各种小错误,商家在自主使用物流系统发货的时候,发现系统无法正确识别地址,导致不能正常发货。
[0005]现有技术中存在多种识别中文地址相对应的技术方案,但此类方案或依赖于大数据训练而成的神经网络模型导致成本较高,或由于企图兼容多种语言而导致对中文地址的检测准确度有限,或因未考虑特定的应用场景而导致与电商领域的实际需求不匹配等,所起作用有限,因此,本申请尝试探索更贴近实际需求以提升电商领域中的中文地址检测效率的方案。

技术实现思路

[0006]本申请的首要目的在于解决上述问题至少之一而提供一种中文地址检测方法及其相应的装置、计算机设备、计算机可读存储介质、计算机程序产品。
[0007]为满足本申请的各个目的,本申请采用如下技术方案:
[0008]适应本申请的目的之一而提供的一种中文地址检测方法,包括如下步骤:
[0009]获取客户端设备提交的中文的地址信息,根据地址信息生成初始地址文本;
[0010]按照预设步长以固定窗口滑动提取所述初始地址文本获得多个分词,以构成初始地址文本的地址特征;
[0011]计算所述初始地址文本的地址特征与为目标地区预设的枚举地址库中的中文的枚举地址的地址特征之间的编辑距离,确定其中编辑距离最小的枚举地址为推荐地址文本;
[0012]向所述客户端设备推送包含所述推荐地址文本的通知消息。
[0013]深化的实施例中,获取客户端设备提交的中文的地址信息,根据地址信息生成初始地址文本,包括如下步骤:
[0014]获取客户端设备提交的电商订单的中文的地址信息,所述地址信息包含与目标地区的多个行政层级相对应的多个地名;
[0015]根据该目标地区的行政层级有序拼接所述多个地名,以生成初始地址文本。
[0016]深化的实施例中,计算所述初始地址文本的地址特征与为目标地区预设的枚举地址库中的中文的枚举地址的地址特征之间的编辑距离的步骤之前,包括如下步骤:
[0017]获取预设的行政地名库,该行政地名库包含目标地区的每个行政层级下的所有可能的中文地名;
[0018]根据行政层级的隶属关系,对所述行政地名库中的各个行政层级的中文地名进行有序拼接,获得由所有行政层级穷举组合而成的全量枚举地址;
[0019]针对每个所述的枚举地址,按照预设步长以固定窗口滑动提取该枚举地址以获得多个分词,构成该枚举地址相应的地址特征,与该枚举地址构造为映射关系数据;
[0020]将全量枚举地址及其地址特征所构成的映射关系数据存储于枚举地址库中。
[0021]深化的实施例中,计算所述初始地址文本的地址特征与为目标地区预设的枚举地址库中的中文的枚举地址的地址特征之间的编辑距离,确定其中编辑距离最小的枚举地址为推荐地址文本,包括如下步骤:
[0022]计算初始地址文本的地址特征的分词数量;
[0023]计算枚举地址库中的任意一个目标枚举地址的地址特征的分词数量;
[0024]计算初始地址文本的分词数量与目标枚举地址两者的分词数量的和值与两者之间相同分词数量的两倍数之间的差值,作为两者之间的编辑距离;
[0025]根据所述编辑距离对枚举地址库中的所有枚举地址进行自小至大的排序,确定其中排序第一位的枚举地址为推荐地址文本。
[0026]扩展的实施例中,向所述客户端设备推送包含所述推荐地址文本的通知消息的步骤之后,包括如下步骤:
[0027]响应基于该通知消息提交的地址修正指令,以所述推荐地址文本作为送货地址修正所述电商订单中的地址信息。
[0028]具体化的实施例中,以所述推荐地址文本作为送货地址修正所述电商订单中的地址信息,包括如下步骤:
[0029]根据所述推荐地址文本对应各个行政层级而设置的地名,替换所述电商订单的地址信息中的各个相应行政层级的地名;
[0030]调用预设的物流计费服务,根据所述电商订单中的地址信息中各行政层级的地名相对应的费率计算出该电商订单的物流成本;
[0031]将该物流成本作为所述电商订单的关联项推送至所述的客户端设备显示。
[0032]适应本申请的目的之一而提供的一种中文地址检测装置,包括:初始地址获取模块、分词特征提取模块、编辑距离优选模块,以及推荐地址推送模块,其中,所述初始地址获取模块,用于获取客户端设备提交的中文的地址信息,根据地址信息生成初始地址文本;所述分词特征提取模块,用于按照预设步长以固定窗口滑动提取所述初始地址文本获得多个分词,以构成初始地址文本的地址特征;所述编辑距离优选模块,用于计算所述初始地址文本的地址特征与为目标地区预设的枚举地址库中的中文的枚举地址的地址特征之间的编辑距离,确定其中编辑距离最小的枚举地址为推荐地址文本;所述推荐地址推送模块,用于向所述客户端设备推送包含所述推荐地址文本的通知消息。
[0033]深化的实施例中,所述初始地址推送模块,包括:地名提取子模块,用于获取客户
端设备提交的电商订单的中文的地址信息,所述地址信息包含与目标地区的多个行政层级相对应的多个地名;地址拼接子模块,用于根据该目标地区的行政层级有序拼接所述多个地名,以生成初始地址文本。
[0034]深化的实施例中,本申请的中文地址检测装置,还包括先于所述编辑距离优选模块调用运行的如下模块:
[0035]地名库调用模块,用于获取预设的行政地名库,该行政地名库包含目标地区的每个行政层级下的所有可能的中文地名;
[0036]地址枚举模块,用于根据行政层级的隶属关系,对所述行政地名库中的各个行政层级的中文地名进行有序拼接,获得由所有行政层级穷举组合而成的全量枚举地址;枚举地址提取模块,用于针对每个所述的枚举地址,按照预设步长以固定窗口滑动提取该枚举地址以获得多个分词,构成该枚举地址相应的地址特征,与该枚举地址构造为映射关系数据;地址库构建模块,用于将全量枚举地址及其地址特征所构成的映射关系数据存储于枚举地址库中。
[0037]深化的实施例中,所述编辑距离优选模块,包括:第一计算子模块,用于计算初始地址文本的地址特征的分词数量;第二计算子模块,用于计算枚举地址库中的任意一个本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种中文地址检测方法,其特征在于,包括如下步骤:获取客户端设备提交的中文的地址信息,根据地址信息生成初始地址文本;按照预设步长以固定窗口滑动提取所述初始地址文本获得多个分词,以构成初始地址文本的地址特征;计算所述初始地址文本的地址特征与为目标地区预设的枚举地址库中的中文的枚举地址的地址特征之间的编辑距离,确定其中编辑距离最小的枚举地址为推荐地址文本;向所述客户端设备推送包含所述推荐地址文本的通知消息。2.根据权利要求1所述的中文地址检测方法,其特征在于,获取客户端设备提交的中文的地址信息,根据地址信息生成初始地址文本,包括如下步骤:获取客户端设备提交的电商订单的中文的地址信息,所述地址信息包含与目标地区的多个行政层级相对应的多个地名;根据该目标地区的行政层级有序拼接所述多个地名,以生成初始地址文本。3.根据权利要求1所述的中文地址检测方法,其特征在于,计算所述初始地址文本的地址特征与为目标地区预设的枚举地址库中的中文的枚举地址的地址特征之间的编辑距离的步骤之前,包括如下步骤:获取预设的行政地名库,该行政地名库包含目标地区的每个行政层级下的所有可能的中文地名;根据行政层级的隶属关系,对所述行政地名库中的各个行政层级的中文地名进行有序拼接,获得由所有行政层级穷举组合而成的全量枚举地址;针对每个所述的枚举地址,按照预设步长以固定窗口滑动提取该枚举地址以获得多个分词,构成该枚举地址相应的地址特征,与该枚举地址构造为映射关系数据;将全量枚举地址及其地址特征所构成的映射关系数据存储于枚举地址库中。4.根据权利要求1所述的中文地址检测方法,其特征在于,计算所述初始地址文本的地址特征与为目标地区预设的枚举地址库中的中文的枚举地址的地址特征之间的编辑距离,确定其中编辑距离最小的枚举地址为推荐地址文本,包括如下步骤:计算初始地址文本的地址特征的分词数量;计算枚举地址库中的任意一个目标枚举地址的地址特征的分词数量;计算初始地址文本的分词数量与目标枚举地址两者的分词数量的和值与两者之间相同分词数量的两倍数之间的差值,作为两者之间的编辑距离...

【专利技术属性】
技术研发人员:叶朝鹏
申请(专利权)人:广州华多网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1