【技术实现步骤摘要】
物流单据品名识别方法、装置及设备
[0001]本申请涉及信息识别
,更具体地说,涉及一种物流单据品名识别方法、装置及设备。
技术介绍
[0002]随着物联网产业链的飞速发展,快递运输为人们的生活带来了许多便利。为了避免快递运输出错,一般通过物流单据实现各个快递的分类。而快递单据中不仅包含寄件人信息以及收件人信息,还包含商品的名称、商品的编码、属性等与商品本身有关的参数,且这些与商品本身有关的参数对于快递公司而言亦是十分重要的。
[0003]现有技术中通过文字识别网络对物流单据的表格区域进行文字识别,实现品名识别,但现有技术仅能对表格区域进行文字识别,一旦物流单据中不存在表格,品名识别准确度降低。
技术实现思路
[0004]有鉴于此,本申请提供了一种物流单据品名识别方法、装置及设备,用于解决现有技术的品名识别方法受限于存在表格的物流单据的缺点。
[0005]为了实现上述目的,现提出的方案如下:
[0006]一种物流单据品名识别方法,包括:
[0007]获取物流单据及品名识别 ...
【技术保护点】
【技术特征摘要】
1.一种物流单据品名识别方法,其特征在于,包括:获取物流单据及品名识别模型;对所述物流单据进行识别,生成一个以上文字块,所述文字块中包含单据字符,各个文字块中的单据字符组成所述物流单据所包含的所有内容;依次从各个所述文字块中选取预测文字块;从各个所述文字块中选取所述预测文字块对应的领域文字块;利用所述领域文字块以及所述预测文字块组成识别数据;将所述识别数据输入至所述品名识别模型中,得到所述品名识别模型预测的所述预测文字块的分类结果,所述分类结果用于表明所述预测文字块中的单据字符是否为品名的组成部分;根据每个文字块及其对应的分类结果,确定所述物流单据的品名。2.根据权利要求1所述的物流单据品名识别方法,其特征在于,获取品名识别模型,包括:获取多个训练单据以及初始品名识别模型,并生成每个所述训练单据对应的训练文字块,所述训练文字块中包含训练单据的单据字符;依次确定每个所述训练文字块对应的训练领域文字块;将每个所述训练文字块及其对应的训练领域文字块进行组合,得到组合数据;根据所述训练文字块中的单据字符是否为品名的组成部分对组合数据进行标注,得到训练数据;将所述训练数据输入至所述初始品名识别模型,得到所述初始品名识别模型的预测结果;基于所述预测结果以及所述训练数据,计算损失值;根据所述损失值对所述初始品名识别模型的参数进行调整,直至所述损失值低于预置的阈值为止,将最终得到的初始品名识别模型作为品名识别模型。3.根据权利要求2所述的物流单据品名识别方法,其特征在于,所述初始品名识别模型包括共享网络、编码识别网络以及分类网络;将所述训练数据输入至所述初始品名识别模型,得到所述初始品名识别模型的预测结果,包括:将所述训练数据输入至所述共享网络,得到所述共享网络提取的共享参数;将所述共享参数分别输入至所述编码识别网络以及所述分类网络,得到所述编码识别网络预测的商品编码以及所述分类网络预测的分类结果,所述商品编码以及所述分类结果组成所述初始品名识别模型的预测结果。4.根据权利要求3所述的物流单据品名识别方法,其特征在于,所述根据所述损失值对所述初始品名识别模型的参数进行调整,包括:根据所述损失值,对所述初始品名识别模型中的共享网络以及分类网络的参数进行调整。5.根据权利要求1所述的物流单据品名识别方法,其特征在于,所述文字块中还包括该文字块的单据字符在所述物流单据中的位置信息;所述从各个所述文字块中选取所述预测文字块对应的领域文字块,包括:
根据每个所述文字块的位置信息,确定所述预测文字块是否存在对应的左文字块、右文字块、上文字块和下文字块;若所述预测文字块存在对应的左文字块,则从各个文字块中选取所述预测文字块的左文字块作为所述预测文字块的领域文字块;若所述预测文字块存在对应的右文字块,则从各个文字块中选取所述预测文字块的右文字块作为所述预测文字块的领域文字块;若所述预...
【专利技术属性】
技术研发人员:卞晓瑜,肖鸣林,何程,
申请(专利权)人:壹沓科技上海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。