一种同城物流配送名片下单技术制造技术

技术编号：25891204 阅读：30 留言：0更新日期：2020-10-09 23:33

本发明专利技术实施例公开了一种基于深度分词网络的自然语言处理技术文字下单方法。该方法应用于配送平台，所述方法包括：获取用户输入的文字下单数据，其中，所述文字下单数据包括收件人、收件地点、收件人电话；根据该数据，利用深度分词网络处理技术，获取其中的姓名、地址和电话信息；然后利用该数据生成下单数据，用于订单的配送。随着互联网技术的普及与发展，电子商务和网络购物蓬勃发展，作为重要的支撑业务，快递行业发展迅速，各快递服务企业的业务量快速增长，快递服务需要严格满足客户对配送时效性的要求，如何保证时效性，不仅需要交通工具、快递人员的及时“就位”，更需要有一个便捷快速的下单方式，以保证各环节的人员能及时获取到有效的信息。本发明专利技术实施例简化了订单下单过程中数据录入过程。

全部详细技术资料下载

【技术实现步骤摘要】
一种同城物流配送名片下单技术所属
本专利涉及数字图像处理领域和自然语言处理领域。
技术介绍
在互联网高速发展的今天，我们都离不开物流。在用户下单时，发现很多用户的寄件/收件信息可以在外卖小票或名片中获得。用户需要对照这些信息手动输入寄件/收件人的姓名、省市区街道地址、电话信息到APP上。而且这些信息中有的内容繁杂，很容易看错导致输入错误，整个过程繁杂且效率低下。因此，用户通过拍照从图片中提取所需信息并完成快速下单的技术就成为迫切需要。本专利可以让用户通过“名片识别”的方式，将名片/小票上的内容识别出对应的寄件/收件人信息文字，快速填到对应栏中。这使得平均寄件下单时间从5分钟减少到10秒，大大提升寄件的用户体验。名片/小票识别一般存在几大挑战。其一是文本是由多个文字甚至是多行文字拼接组成，没有明显边界，文本框内除了笔画，其余部分均是背景，给识别特征提取带来难度；其二是文本可能是由若干汉字、英文或标点符号混合在一起，长度变化大，由于网络感知野受限，定位边框(BoundingBoxes)本身困难；其三是如果边框贴合精度不够，会直接导致后续的文字识别错误；其四是获取的所有文本内容繁杂，可能包含多个电话号码，多个地址，给从中选择出手机号码和地址带来了困难。为了解决这些问题，本专利为名片识别下单技术搭建了光学字符识别(OpticalCharacterRecognition，OCR)和自然语言处理(NaturalLanguageProcessing，NLP)结合的系统。OCR识别在文本检测上运用了CTPN检测网络，...

【技术保护点】
1.一种下单方法，应用于配送平台，其特征在于，所述方法包括：/n获取用户输入的下单文字，其中，所述下单文字数据包括人物姓名、地址和联系电话，客户端将该数据上传至服务器。/n

【技术特征摘要】
1.一种下单方法，应用于配送平台，其特征在于，所述方法包括：
获取用户输入的下单文字，其中，所述下单文字数据包括人物姓名、地址和联系电话，客户端将该数据上传至服务器。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：
用户上传的文字下单数据，将数据存储信息同步至文字识别服务器，其中，所述文字存储信息包括所述文字信息的存储位置。

3.一种命名实体识别方法，应用于文字下单数据识别，其特征在于，所述方法包括：
步骤一：模型设计
本文设计了一种基于Bilstm+crf模型，模型的结构如图1所示，将数据输入双向lstm后提取语义特征，双向lstm每个节点上会输出当前字对应各标注的对数概率值，如下图所示的[1.5，0.9，0.1，0.08，0.05]，分别对应PER-B，PER-I，ORG-B，ORG-I，O，即姓名开始，姓名内部，机构开始，机构内部，非实体标签的概率，最后将这些结果输进crf层，在crf层采用维特比算法解码，将具有最大得分的序列作为预测输出，从而得到最终的标注结果。
步骤二：模型训练
模型的训练主要分为以下两个环节。
1.首先下载命名实体识别公开语料，对数据进行简单处理，分割成类似如下图2所示，其中v表示动词，PER表示人名，B表示实体开始，I表示实体内部等。将数据准备好，放入模型中训练至收敛。也可以直接下载开源模型使用。
2.在本地数据中进行测试。经过测试发现模型对特殊姓名的提取尚存在问题，如图3所示，该图为存在标注问题的样本。
步骤三：设计信息提取规则
通过上一个步骤的训练，核心的识别模型已基本可用。下面将要设计一个提取逻辑来将各要素依次识别出。分为以下五个部分：
1.通过观察大量线上用户输入文本内容，发现用户电话的提取相对较为固定，可以设置一个正则表达式来匹配，比如：
r’(\+？0？86\D*？)？(1[-\s]？[3-9][-\s]？(\d[-\s]...

【专利技术属性】
技术研发人员：李思远，覃飞宇，朱冠军，张罡，
申请(专利权)人：北京同城必应科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人