基于机器学习的快递标准地址生成方法技术

技术编号:39576885 阅读:26 留言:0更新日期:2023-12-03 19:28
本发明专利技术涉及快递标准地址生成技术领域,公开了一种基于机器学习的快递标准地址生成方法

【技术实现步骤摘要】
基于机器学习的快递标准地址生成方法、装置、设备及存储介质


[0001]本专利技术涉及快递标准化地址自动生成
,尤其涉及一种基于机器学习的快递标准地址生成方法

装置

设备及存储介质


技术介绍

[0002]目前,快递行业在派送时经常会遇到用户填写的地址不规范

不完整的问题,导致快递员无法准确送达或者造成无法必要的退回

这主要是由于用户地址信息缺乏标准化处理

不规范地址的问题主要表现在
:
[0003]1)
缺少必要的地址信息,如省市区

街道

门牌号等,使得无法明确确定送达地点

[0004]2)
用户自行创造的地址缩写,如“东二环中路”,快递员不一定可以理解

[0005]3)
格式混乱,如门牌号写在前面,省市区晚写等

[0006]4)
各类拼写错误,使地址解释困难/>。
[0本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种基于机器学习的快递标准地址生成方法,其特征在于,所述基于机器学习的快递标准地址生成方法包括:获取预设时间段内的历史快递单数据,从获取到的历史快递单数据中抽取收件人地址字段信息,将抽取到的历史快递单数据中的收件人地址字段信息作为训练数据集;获取训练数据集中若干的样本数据,获取与样本数据对应的非系统生成的标准化地址信息;提取获取到的与样本数据对应的标准化地址信息中的词语或词组

地址长度特征和单字特征,基于词语或词组

地址长度特征和单字特征生成地址标准化模型;构建基于
LSTM
的深度神经网络;其中,输入层为地址字段信息,输出层为标准化地址信息;使用
Keras
框架训练地址标准化模型,针对地址标准化模型的生成过程进行模型调优,获得初步完成的地址标准化模型;对获取到的初步完成的地址标准化模型进行优化,得到
LSTM
模型;对得到的
LSTM
模型进行封装,得到
API
服务;将
API
服务容器化后部署至云服务器;获取用户地址信息,调用
API
服务对用户地址信息进行地址标准化,得到标准化地址信息,将获取到的标准化地址信息发送至用户端进行确认,接收用户端的确认结果信息;获取用户反馈的地址标准化错误信息,将获取到的地址标准化错误信息加入至训练数据集;定期对地址标准化模型进行重新训练
。2.
根据权利要求1所述的基于机器学习的快递标准地址生成方法,其特征在于,所述提取获取到的与样本数据对应的标准化地址信息中的词语或词组

地址长度特征和单字特征,基于词语或词组

地址长度特征和单字特征生成地址标准化模型包括:提取获取到的与样本数据对应的标准化地址信息中的词语或词组

地址长度特征和单字特征基于提取到的词语或词组生成用以表示标准化地址信息的词向量信息;将词向量信息

地址长度特征和单字特征串联作为地址标准化模型
。3.
根据权利要求2所述的基于机器学习的快递标准地址生成方法,其特征在于,所述构建基于
LSTM
的深度神经网络;其中,输入层为地址字段信息,输出层为标准化地址信息;使用
Keras
框架训练地址标准化模型,针对地址标准化模型的生成过程进行模型调优,获得初步完成的地址标准化模型包括:使用
Keras Functional API
定义
LSTM
网络结构;将
LSTM
网络结构中的输入层与
Address
特征维度的
Dense
层连接,在
LSTM
网络结构输入层和输出层中间添加2层
LSTM
层和1层全连接层,所述
LSTM
网络结构的输出层是一个
Dense
层预测标准化地址,生成地址标准化模型;对地址标准化模型进行编译;其中,使用
Adam
优化器进行优化,
loss
函数选用
CTC loss
;设置回调函数;其中,包括
ModelCheckpoint
函数和
EarlyStopping
函数,所述
ModelCheckpoint
函数用于保存最佳模型,所述
EarlyStopping
函数用于避免过拟合;载入
Address
数据集,提取特征,缩放到0‑1范围,按
batch
输入模型进行迭代训练;在训练过程中调整
LSTM
层隐状态维度结构和层数结构,优化
CTC loss
计算方式;针对
Address Standardization
任务,调整
CTC loss
权重,增强对关键输出的惩罚;
完成多轮训练后,选择
validation loss
最低的模型作为初步完成的地址标准化模型,并将初步完成的地址标准化模型保存为
h5
格式;还包括,使用
Tenso...

【专利技术属性】
技术研发人员:郭金峰李波涛肖广明
申请(专利权)人:上海东普信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1