【技术实现步骤摘要】
地址信息提取方法、装置、计算机设备和存储介质
[0001]本申请涉及计算机
,特别是涉及一种地址信息提取方法、装置、计算机设备和存储介质。
技术介绍
[0002]随着计算机技术与物流技术的快速发展,快递逐渐成为人们生产生活中不可或缺的一部分。快递又称速递或快运,是指物流企业(含货运代理)通过自身的独立网络或以联营合作(即联网)的方式,将用户委托的文件或包裹,快捷而安全地从发件人送达收件人的门到门(手递手)的新型运输方式。在快递运输中,一般需要托运人填写运单来获取快递相应的寄件人、托运物品以及目的地址等信息。
[0003]然而,由于运单的地址信息一般是客户填写的原始文本,因为填写习惯和细化地址的差异,文本信息呈现了明显多样性和书写差异。当前运单标签上地址信息即为客户填写的内容,不规范的填写内容大大影响相关作业人员的操作效率,进而影响快递的派送时效。
技术实现思路
[0004]基于此,有必要针对上述技术问题,提供一种能够可以有效提高地址信息识别效率的地址信息提取方法、装置、计算机设备和存储介质。r/>[0005]一本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种地址信息提取方法,所述方法包括:获取待识别快递运单;提取所述待识别快递运单的原始地址信息;对所述原始地址信息中的层级地址信息进行标注,获取标注地址信息;根据所述标注地址信息与预设关键地址集,获取所述原始地址信息对应的标准地址信息。2.根据权利要求1所述的方法,其特征在于,所述根据所述标注地址与预设关键地址集,获取所述原始地址信息中的标准地址信息包括:获取所述标注地址信息中的关键地址,与预设关键地址集中标准关键地址的相似度;根据所述相似度,识别所述标注地址信息对应的标准关键地址;根据所述标注地址信息与所述标准关键地址,获取所述原始地址信息对应的标准地址信息。3.根据权利要求2所述的方法,其特征在于,所述获取所述标注地址信息,与预设关键地址集中标准关键地址的相似度包括:根据所述标注地址信息中的标注,识别所述标注地址信息中的兴趣面地址与标注关键地址;查找所述兴趣面地址对应的预设关键地址集;通过基于计算Word Embedding余弦距离的fasttext文本相似度算法,获取所述标注关键地址与所述预设关键地址集中标准关键地址的相似度。4.根据权利要求2所述的方法,其特征在于,所述获取所述标注地址信息,与预设关键地址集中标准关键地址的相似度之前,还包括:获取带层级地址信息标注的历史快递运单数据;根据所述层级地址信息标注,识别所述历史快递运单数据中的兴趣面地址,以及所述兴趣面地址对应的关键地址的地址组合;对兴趣面地址相同的所述地址组合进行聚类,构建各兴趣面地址对应的预设关键地址集。5.根据权利要求4所述的方法,其特征在于,所述对兴趣面地址相同的所述地址组合进行聚类,构建各兴趣面地址对应的预设关键地址集...
【专利技术属性】
技术研发人员:姚淳子,王俊翔,刘龙威,李崇贵,仝淑雅,
申请(专利权)人:顺丰科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。