提货单信息提取方法、装置及计算机设备制造方法及图纸

技术编号:33123832 阅读:12 留言:0更新日期:2022-04-17 00:30
本申请涉及一种提货单信息提取方法、装置、计算机设备、计算机可读存储介质和计算机程序产品,该方法包括:获取提货单图片,基于第一模型对提货单图片进行文本框检测,获得提货单图片中文本框的坐标信息;将文本框的坐标信息以及提货单图片输入第二模型,获得文本框对应的文本信息;根据文本信息、坐标信息以及模板库,确定与提货单图片匹配的目标提货单模板;根据文本信息以及目标提货单模板生成参考提货单,对参考提货单进行关键信息提取,获得提货单图片对应的提货单信息。本申请提供的提货单信息提取方法,能够实现提高对提货单图片识别准确率的技术效果。识别准确率的技术效果。识别准确率的技术效果。

【技术实现步骤摘要】
提货单信息提取方法、装置及计算机设备


[0001]本申请涉及数据处理
,特别是涉及一种提货单信息提取方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]在国际贸易中,提货单是由运输公司交给承运人或者收货人,以便承运人或者收货人能够从船上、飞机上或仓库等地方提取货物的凭证。在国贸单证业务的日常工作中,每天会产生大量的数据录入需求。
[0003]在承运人或者收货人去进行货物提取的时候,需要对提货单上的信息进行识别以根据识别的结果形成单证进行留存。但是,目前由于纸质提货单上存在例如文字墨水太深、字符间结构改变、签章干扰等情况,导致对纸质单中有效信息的识别准确率低。

技术实现思路

[0004]本申请提供了一种提货单信息提取方法、装置、计算机设备、计算机可读存储介质和计算机程序产品,基于多种模型对提货单图片进行识别,能够对提货单图片中的信息进行有效的识别,提高了对提货单图片的识别准确率。
[0005]第一方面,本申请提供了一种提货单信息提取方法,该方法包括:
[0006]获取提货单图片,基于第一模型对提货单图片进行文本框检测,获得提货单图片中文本框的坐标信息;
[0007]将文本框的坐标信息以及提货单图片输入第二模型,获得文本框对应的文本信息;
[0008]根据文本信息和坐标信息进行模板库匹配,确定与提货单图片匹配的目标提货单模板;
[0009]根据文本信息以及目标提货单模板生成参考提货单,对参考提货单进行关键信息提取,获得提货单图片对应的提货单信息。
[0010]第二方面,本申请还提供了一种提货单信息提取装置,该装置包括:
[0011]获取检测模块,用于获取提货单图片,基于第一模型对提货单图片进行文本框检测,获得提货单图片中文本框的坐标信息;
[0012]识别模块,用于将文本框的坐标信息以及提货单图片输入第二模型,获得文本框对应的文本信息;
[0013]匹配确定模块,用于根据文本信息和坐标信息进行模板库匹配,确定与提货单图片匹配的目标提货单模板;
[0014]提取模块,用于根据文本信息以及目标提货单模板生成参考提货单,对参考提货单进行关键信息提取,获得提货单图片对应的提货单信息。
[0015]第三方面,本申请还提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述任一项的方法的步骤:
[0016]第四方面,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一项的方法的步骤。
[0017]第五方面,本申请还提供了一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现上述任一项的方法的步骤。
[0018]本申请提供了一种提货单信息提取方法、装置、计算机设备、计算机可读存储介质和计算机程序产品,该方法包括:获取提货单图片,基于第一模型对提货单图片进行文本框检测,获得提货单图片中文本框的坐标信息;将文本框的坐标信息以及提货单图片输入第二模型,获得文本框对应的文本信息;根据文本信息、坐标信息以及模板库,确定与提货单图片匹配的目标提货单模板;根据文本信息以及目标提货单模板生成参考提货单,对参考提货单进行关键信息提取,获得提货单图片对应的提货单信息。本申请提供的提货单信息提取方法,基于第一模型对提货单图片中的文本框进行定位,基于第二模型对对应文本框中的文本信息进行识别,由于第一模型和第二模型均为添加干扰信息之后的历史提货单训练得到的,所以对文本框的定位以及对应文本信息的识别都比较准确,同时,基于丰富的模板库与提货单图片进行匹配,提高了提货单图片的匹配率,更进一步的能够基于提货单的模板对关键信息进行提取,综合处理后,能够实现提高对提货单图片识别准确率的技术效果。
附图说明
[0019]图1为一个实施例中提货单信息提取方法的应用环境图;
[0020]图2为一个实施例中提货单信息提取方法的流程示意图;
[0021]图3为一个实施例中提货单信息提取步骤的流程示意图;
[0022]图4为另一个实施例中提货单信息提取方法的流程示意图;
[0023]图5为另一个实施例中提货单信息提取方法的流程示意图;
[0024]图6为另一个实施例中提货单信息提取方法的流程示意图;
[0025]图7为另一个实施例中提货单信息提取方法的流程示意图;
[0026]图8为一个实施例中提货单信息提取装置的结构框图;
[0027]图9为一个实施例中计算机设备的内部结构图。
具体实施方式
[0028]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0029]本申请实施例提供的提货单信息提取方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。终端102采集提货单图片,通过网络将获取的提货单图片发送给服务器104,服务器104将该提货单图片输入至第一模型中进行文本框检测,获得提货单中文本框的坐标信息,然后,将文本框的坐标信息和提货单图片再输入至第二模型中进行文本识别,获得每一个文本框对应的文本信息,根据文本信息、坐标信息以及模板库,确定与提货单图片匹配的目标提货单模
板;根据文本信息以及目标提货单模板生成参考提货单,对参考提货单进行关键信息提取,获得提货单图片对应的提货单信息,能够实现提高对提货单图片识别准确率的技术效果。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、照相机、摄像机、扫描仪和便携式可穿戴设备。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
[0030]在一个实施例中,如图2所示,提供了一种提货单信息提取方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
[0031]步骤S202,获取提货单图片,基于第一模型对提货单图片进行文本框检测,获得提货单图片中文本框的坐标信息。
[0032]其中,提货单是由运输公司交给承运人或者收货人,以便承运人或者收货人能够从船上、飞机上或仓库等地方提取货物的凭证。提货单可以是运输公司开具的一种纸质的单据,提货单上可以是包括收货人信息、寄货人信息、港口信息、仓库信息、承运人信息、代理人信息、运单号信息等多种不同类型的信息。提货单一方面用于提货,一方面需要将提货单上的相关信息提供给金融机构,以便金融机构对发货方和收货方之间的货款进行处理。
[0033]那么,对提货单进行信息提取可以应用于提货过程中,也可以应用在金融机构进行货款处理的过程中,本申请对此不加以限定。
[0034]提货本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种提货单信息提取方法,其特征在于,所述方法包括:获取提货单图片,基于第一模型对所述提货单图片进行文本框检测,获得所述提货单图片中文本框的坐标信息;将所述文本框的坐标信息以及所述提货单图片输入第二模型,获得所述文本框对应的文本信息;根据所述文本信息和所述坐标信息进行模板库匹配,确定与所述提货单图片匹配的目标提货单模板;根据所述文本信息以及所述目标提货单模板生成参考提货单,对所述参考提货单进行关键信息提取,获得所述提货单图片对应的提货单信息。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:若根据所述文本信息、所述坐标信息与所述模板库匹配失败,则将所述文本信息、所述坐标信息输入通用匹配模型,获得所述提货单图片对应的提货单信息。3.根据权利要求1所述的方法,其特征在于,所述第一模型的训练过程包括:获取多个第一历史提货单图片,对所述第一历史提货单图像进行干扰添加处理,获得每一第一历史提货单图片对应的初始图像样本;对每一所述初始图像样本进行文本框标定处理,基于处理后的初始图像样本进行模型训练,获得所述第一模型。4.根据权利要求1所述的方法,其特征在于,所述第二模型的训练过程包括:获取多个第二历史提货单图片,对所述第二历史提货单图像进行文本干扰添加处理,获得每一第二历史提货单图片对应的初始图像样本;对每一所述初始图像样本进行文本标定处理,基于处理后的初始图像样本进行模型训练,获得所述第二模型。5.根据权利要求1所述的方法,其特征在于,所述根据所述文本信息、所述坐标信息以及模板库,确定与所述提货单图片匹配的目标提货单模板,包括:获取所述提货单图片的唯一标记,所述唯一标记用于表征所述提货单图片的来源;基于所述唯一标记以及所述模板库中各个提货单模板的唯一标记,从所述模板库中匹配出多个候选提货单模板;根据所述文本信息以及所述坐标...

【专利技术属性】
技术研发人员:陈鹏宇李捷王巍
申请(专利权)人:上海浦东发展银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1