物流单据品名识别方法、装置及设备制造方法及图纸

技术编号:37273864 阅读:16 留言:0更新日期:2023-04-20 23:41
本申请公开了一种物流单据品名识别方法、装置及设备,该方法包括获取物流单据及品名识别模型;对物流单据进行识别,生成一个以上文字块,文字块中包含单据字符,各个文字块中的单据字符组成物流单据所包含的所有内容;依次从各个文字块中选取预测文字块;从各个文字块中选取预测文字块对应的领域文字块;利用领域文字块和预测文字块组成识别数据;将识别数据输入至品名识别模型中,得到品名识别模型预测的预测文字块的分类结果,分类结果用于表明预测文字块中的单据字符是否为品名的组成部分;根据每个文字块及其对应的分类结果,确定物流单据的品名。可见,本申请在确定品名的过程中,并不受限于物流单据中是否存在表格区域。并不受限于物流单据中是否存在表格区域。并不受限于物流单据中是否存在表格区域。

【技术实现步骤摘要】
物流单据品名识别方法、装置及设备


[0001]本申请涉及信息识别
,更具体地说,涉及一种物流单据品名识别方法、装置及设备。

技术介绍

[0002]随着物联网产业链的飞速发展,快递运输为人们的生活带来了许多便利。为了避免快递运输出错,一般通过物流单据实现各个快递的分类。而快递单据中不仅包含寄件人信息以及收件人信息,还包含商品的名称、商品的编码、属性等与商品本身有关的参数,且这些与商品本身有关的参数对于快递公司而言亦是十分重要的。
[0003]现有技术中通过文字识别网络对物流单据的表格区域进行文字识别,实现品名识别,但现有技术仅能对表格区域进行文字识别,一旦物流单据中不存在表格,品名识别准确度降低。

技术实现思路

[0004]有鉴于此,本申请提供了一种物流单据品名识别方法、装置及设备,用于解决现有技术的品名识别方法受限于存在表格的物流单据的缺点。
[0005]为了实现上述目的,现提出的方案如下:
[0006]一种物流单据品名识别方法,包括:
[0007]获取物流单据及品名识别模型;
[0008]对所述物流单据进行识别,生成一个以上文字块,所述文字块中包含单据字符,各个文字块中的单据字符组成所述物流单据所包含的所有内容;
[0009]依次从各个所述文字块中选取预测文字块;
[0010]从各个所述文字块中选取所述预测文字块对应的领域文字块;
[0011]利用所述领域文字块以及所述预测文字块组成识别数据;
[0012][0013]将所述识别数据输入至所述品名识别模型中,得到所述品名识别模型预测的所述预测文字块的分类结果,所述分类结果用于表明所述预测文字块中的单据字符是否为品名的组成部分;
[0014]根据每个文字块及其对应的分类结果,确定所述物流单据的品名。
[0015]可选的,所述获取品名识别模型,包括:
[0016]获取多个训练单据以及初始品名识别模型,并生成每个所述训练单据对应的训练文字块,所述训练文字块中包含训练单据的单据字符;
[0017]依次确定每个所述训练文字块对应的训练领域文字块;
[0018]将每个所述训练文字块及其对应的训练领域文字块进行组合,得到组合数据;
[0019]根据所述训练文字块中的单据字符是否为品名的组成部分对组合数据进行标注,得到训练数据;
[0020]将所述训练数据输入至所述初始品名识别模型,得到所述初始品名识别模型的预测结果;
[0021]基于所述预测结果以及所述训练数据,计算损失值;
[0022]根据所述损失值对所述初始品名识别模型的参数进行调整,直至所述损失值低于预置的阈值为止,将最终得到的初始品名识别模型作为品名识别模型。
[0023]可选的,所述初始品名识别模型包括共享网络、编码识别网络以及分类网络;
[0024]将所述训练数据输入至所述初始品名识别模型,得到所述初始品名识别模型的预测结果,包括:
[0025]将所述训练数据输入至所述共享网络,得到所述共享网络提取的共享参数;
[0026]将所述共享参数分别输入至所述编码识别网络以及所述分类网络,得到所述编码识别网络预测的商品编码以及所述分类网络预测的分类结果,所述商品编码以及所述分类结果组成所述初始品名识别模型的预测结果。
[0027]可选的,所述根据所述损失值对所述初始品名识别模型的参数进行调整,包括:
[0028]根据所述损失值,对所述初始品名识别模型中的共享网络以及分类网络的参数进行调整。
[0029]可选的,所述文字块中还包括该文字块的单据字符在所述物流单据中的位置信息;
[0030]所述从各个所述文字块中选取所述预测文字块对应的领域文字块,包括:
[0031]根据每个所述文字块的位置信息,确定所述预测文字块是否存在对应的左文字块、右文字块、上文字块和下文字块;
[0032]若所述预测文字块存在对应的左文字块,则从各个文字块中选取所述预测文字块的左文字块作为所述预测文字块的领域文字块;
[0033]若所述预测文字块存在对应的右文字块,则从各个文字块中选取所述预测文字块的右文字块作为所述预测文字块的领域文字块;
[0034]若所述预测文字块存在对应的上文字块,则从各个文字块中选取所述预测文字块的上文字块作为所述预测文字块的领域文字块;
[0035]若所述预测文字块存在对应的下文字块,则从各个文字块中选取所述预测文字块的下文字块作为所述预测文字块的领域文字块。
[0036]可选的,根据每个所述文字块的位置信息,确定所述预测文字块是否存在对应的左文字块、右文字块、上文字块和下文字块,包括:
[0037]根据各个文字块的位置信息,确定各个文字块中是否存在任一文字块的单据字符位于所述预测文字块单据字符的左端,以确定所述预测文字块是否存在对应的左文字块;
[0038]根据各个文字块的位置信息,确定各个文字块中是否存在任一文字块的单据字符位于所述预测文字块单据字符的右端,以确定所述预测文字块是否存在对应的右文字块;
[0039]根据各个文字块的位置信息,确定各个文字块中是否存在任一文字块的单据字符位于所述预测文字块单据字符的上端,以确定所述预测文字块是否存在对应的上文字块;
[0040]根据各个文字块的位置信息,确定各个文字块中是否存在任一文字块的单据字符位于所述预测文字块单据字符的下端,以确定所述预测文字块是否存在对应的下文字块。
[0041]可选的,所述利用所述领域文字块以及所述预测文字块组成识别数据,包括:
[0042]根据预置的组合模板,对所述预测文字块以及所述领域文字块进行组合,得到识别数据。
[0043]可选的,所述根据每个文字块及其对应的分类结果,确定所述物流单据的品名,包括:
[0044]根据每个文字块及其对应的分类结果,从各个文字块中提取属于品名组成部分的目标单据字符;
[0045]根据所述目标单据字符及其对应的分类结果,得到所述物流单据对应的品名。
[0046]一种物流单据品名识别装置,包括:
[0047]单据获取单元,用于获取物流单据及品名识别模型;
[0048]文字块生成单元,用于对所述物流单据进行识别,生成一个以上文字块,所述文字块中包含单据字符,各个文字块中的单据字符组成所述物流单据所包含的所有内容;
[0049]预测文字块选取单元,用于依次从各个所述文字块中选取预测文字块;
[0050]领域文字块选取单元,用于从各个所述文字块中选取所述预测文字块对应的领域文字块;
[0051]领域文字块利用单元,用于利用所述领域文字块以及所述预测文字块组成识别数据;
[0052]识别数据输入单元,用于将所述识别数据输入至所述品名识别模型中,得到所述品名识别模型预测的所述预测文字块的分类结果,所述分类结果用于表明所述预测文字块中的单据字符是否为品名的组成部分本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种物流单据品名识别方法,其特征在于,包括:获取物流单据及品名识别模型;对所述物流单据进行识别,生成一个以上文字块,所述文字块中包含单据字符,各个文字块中的单据字符组成所述物流单据所包含的所有内容;依次从各个所述文字块中选取预测文字块;从各个所述文字块中选取所述预测文字块对应的领域文字块;利用所述领域文字块以及所述预测文字块组成识别数据;将所述识别数据输入至所述品名识别模型中,得到所述品名识别模型预测的所述预测文字块的分类结果,所述分类结果用于表明所述预测文字块中的单据字符是否为品名的组成部分;根据每个文字块及其对应的分类结果,确定所述物流单据的品名。2.根据权利要求1所述的物流单据品名识别方法,其特征在于,获取品名识别模型,包括:获取多个训练单据以及初始品名识别模型,并生成每个所述训练单据对应的训练文字块,所述训练文字块中包含训练单据的单据字符;依次确定每个所述训练文字块对应的训练领域文字块;将每个所述训练文字块及其对应的训练领域文字块进行组合,得到组合数据;根据所述训练文字块中的单据字符是否为品名的组成部分对组合数据进行标注,得到训练数据;将所述训练数据输入至所述初始品名识别模型,得到所述初始品名识别模型的预测结果;基于所述预测结果以及所述训练数据,计算损失值;根据所述损失值对所述初始品名识别模型的参数进行调整,直至所述损失值低于预置的阈值为止,将最终得到的初始品名识别模型作为品名识别模型。3.根据权利要求2所述的物流单据品名识别方法,其特征在于,所述初始品名识别模型包括共享网络、编码识别网络以及分类网络;将所述训练数据输入至所述初始品名识别模型,得到所述初始品名识别模型的预测结果,包括:将所述训练数据输入至所述共享网络,得到所述共享网络提取的共享参数;将所述共享参数分别输入至所述编码识别网络以及所述分类网络,得到所述编码识别网络预测的商品编码以及所述分类网络预测的分类结果,所述商品编码以及所述分类结果组成所述初始品名识别模型的预测结果。4.根据权利要求3所述的物流单据品名识别方法,其特征在于,所述根据所述损失值对所述初始品名识别模型的参数进行调整,包括:根据所述损失值,对所述初始品名识别模型中的共享网络以及分类网络的参数进行调整。5.根据权利要求1所述的物流单据品名识别方法,其特征在于,所述文字块中还包括该文字块的单据字符在所述物流单据中的位置信息;所述从各个所述文字块中选取所述预测文字块对应的领域文字块,包括:
根据每个所述文字块的位置信息,确定所述预测文字块是否存在对应的左文字块、右文字块、上文字块和下文字块;若所述预测文字块存在对应的左文字块,则从各个文字块中选取所述预测文字块的左文字块作为所述预测文字块的领域文字块;若所述预测文字块存在对应的右文字块,则从各个文字块中选取所述预测文字块的右文字块作为所述预测文字块的领域文字块;若所述预...

【专利技术属性】
技术研发人员:卞晓瑜肖鸣林何程
申请(专利权)人:壹沓科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1