一种基于深度学习的智能物流地址实体识别系统技术方案

技术编号:33087000 阅读:26 留言:0更新日期:2022-04-15 10:52
本发明专利技术公开一种基于深度学习的智能物流地址实体识别系统,其特征在于,该系统组成包括有地址实体数据标注模块、BERT编码器模块和结果解析模块,地址实体数据标注模块接收地址结构化数据,获得高质量的已标注地址实体数据;BERT编码器模块进行深度学习算法学习物流业务实际应用场景的特定句子的编码表示,训练完成获得地址实体识别模型;结构解析模块基于训练完成的地址实体识别模块,在输入物流地址后输出由所输入地址提取的实体内容;还涉及到地址实体的识别提取方法。本发明专利技术解决了人工标注数据缓慢的问题,可以准确识别出的实体为一个网点下的主要实体,从而保证地址实体提取的准确性。准确性。准确性。

【技术实现步骤摘要】
一种基于深度学习的智能物流地址实体识别系统


[0001]本专利技术涉及物流
,特别是一种基于深度学习的智能物流地址实体提取识别系统及物流地址实体的提取识别方法。

技术介绍

[0002]当前智能化越来越成为时代的关键词互联网、物联网、大数据、人工智能等技术不断发展给多个行业带来创新的推动力,所谓智能物流是指通过先进的物流网技术实现物资运输过程的自动化运作和高效化管理.物流行业的智能化对于中国物流行业提高利润、降低物流成本具有积极的推动作用。
[0003]而作为智能物流的核心组成部分,“三段码”由三段编码构成:一段码(转运中心)+二段码(独立网点)+三段码(派件员)+四段码(末端实体)。一二三段码是通过对转运中心、独立网点和派件员进行编码。上述四段码则是根据地址数据对每个网点下派送的末端实体进行识别提取,从而提升物流的分拣效率,节约人员成本。在现有技术中,尚没有对四段码进行应用和提取的案例,即使有也是人工实现,存在着识别困难和识别准确率过低的问题。本专利技术拟就末端实体的应用和提取进行探索,以促进物流业的快速发展。
专利技术内本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的智能物流地址实体识别系统,其特征在于,该系统组成包括有地址实体数据标注模块、BERT编码器模块和结果解析模块,其中,所述地址实体数据标注模块接收地址结构化数据,并对接收的地址结构化数据进行数据清洗,获得高质量的已标注地址实体数据;所述的BERT编码器模块基于已标注地址实体数据,进行深度学习算法学习物流业务实际应用场景的特定句子的编码表示,训练完成获得地址实体识别模型;所述的结构解析模块基于训练完成的地址实体识别模块,在输入物流地址时,对输入地址信息数据进行解析,解析完成后输出由所输入地址提取的实体内容。2.根据权利要求1所述的一种基于深度学习的智能物流实体识别系统,其特征在于,在所述的BERT编码器模块中设有BERT编码器、全连接层、softmax分类器和分类优化器,所述BERT编码器处理输入的地址实体数据得到数据的向量表示,全连接层对数据向量表示增加权重,softmax分类器得到预测结果,分类优化器逐层调整模型权重实现模型迭代优化。3.一种基于深度学习的智能物流地址实体的识别提取方法,其特征在于,该识别提取方法包括如下步骤:第一步,数据预处理,将历史运单数据筛选,删除重复数据,获得干净的地址实体集;第二步,地址实体集清洗,并对清洗后数据进行标注提取,经筛选过滤后提取有意义的实体数据,获得模型训练所用的数据;第三步,BERT编码及模型训练,由BERT编码得到地址数据的向量表示,经模型训练和优化得到物流地址实体识别模型;第四步,输入地址及结果解析,将物流地址输入至训练得到的物流地址实体识别模型,经过解析输出获得物流地址中的实体内容。4.根据权利要求3所述的一种基于深度学习的智能物流地址实体的识别提取方法,其特征在于,在所述第一步中,将历史运单数据进行筛选过滤,对省市区+详细地址拼接的数据进行省市区递归删除,删除省市区部分重复的数据,对进行了递归删除的地址进行MD...

【专利技术属性】
技术研发人员:林嘉华倪嘉辉姜东晓
申请(专利权)人:上海捷晓信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1