电子设备及其单据识别录入方法、介质技术

技术编号:32644537 阅读:24 留言:0更新日期:2022-03-12 18:23
本申请涉及一种电子设备及其单据识别录入方法、介质。该方法包括:获取第一单据包括的至少一个第一业务字段;确定第一业务字段对应的基准字段,以及基准字段对应的至少一个同义字段,基准字段为第一业务字段的对应的业务领域中的统一名称;将第一业务字段与基准字段以及同义字段进行匹配,若第一业务字段匹配到基准字段或者同义字段中的至少一个,获取并保存第一业务字段对应的业务内容。通过本申请的方法,在识别不同货主开具的业务单据时,可以获得业务单据中每一种业务字段的统一用语,能够确定不同种类的业务单据中的标准统一的业务字段的名称,减少了业务员进行人工检验的工作量,提高了物流业务的效率和准确率。提高了物流业务的效率和准确率。提高了物流业务的效率和准确率。

【技术实现步骤摘要】
电子设备及其单据识别录入方法、介质


[0001]本申请实施例涉及文字图像识别领域,尤其涉及一种电子设备及其单据识别录入方法、介质。

技术介绍

[0002]在物流行业中,各类业务单据上的字段记录着货物信息。处理业务单据的工作人员(以下简称业务员)可以使用电子设备来识别并处理业务单据上的各个业务字段对应的信息。例如:对于货物的发货单,可以将发货单扫描成图像后,通过图像识别的方法,识别出诸如:“货物名称”、“货物号”、“货物数量”等业务字段,在获取业务字段对应的业务内容,诸如:货物名称为“钢材A”、货物数量为“100吨”等,最后将获取的业务字段的信息保存至物流数据系统。
[0003]但是,钢铁物流行业中存在各类的货主,如源头钢厂、中间贸易商、终端用钢单位,每家开具的同一类型的业务单据中在业务字段的名称上存在很大差异,在导致业务单据中会包含含义相同但名称不同的业务字段,比如,不同发货单上的“吨位”、“吨数”皆表示货物重量。从而导致电子设备不能识别出名称不同但含义相同的业务字段。针对上述情况,业务员往往会采用人工方式进行业务单据比对、校验和录入,造成业务效率低下,物流整体成本居高。

技术实现思路

[0004]本申请实施例提供一种电子设备及其单据识别录入方法、介质。
[0005]本申请的第一方面提供了一种单据识别录入方法,用于电子设备,包括:
[0006]获取第一单据包括的至少一个第一业务字段;
[0007]确定第一业务字段对应的基准字段,以及基准字段对应的至少一个同义字段,基准字段为第一业务字段的对应的业务领域中的统一名称;
[0008]将第一业务字段与基准字段以及同义字段进行匹配,若第一业务字段匹配到基准字段或者同义字段中的至少一个,获取并保存第一业务字段对应的业务内容。
[0009]即在本申请的实施例中,电子设备可以计算机,电子设备可以从第一单据对应的单据图像中识别出第一业务字段。单据图像可以是通过扫描仪或者手机对第一单据拍摄后获取的。这里的基准字段也就是统一名称,统一名称可以用于唯一标识第一业务字段标识的业务内容,如:“捆包号”可以表示货物编号。同义字段可以是与基准字段名称不同但是含义相同的业务字段名称,如:“材料号”“资源号”都可以表示货物编号。“材料号”“资源号”可以是基准字段“捆包号”的同义字段。第一业务字段与基准字段以及同义字段进行匹配可以是从基准字段以及同义字段中查找与第一业务字段相同的字段。
[0010]通过本申请的第一方面提供的方法,在识别不同货主开具的业务单据时,可以获得业务单据中每一种业务字段的统一用语,使得在完成对不同种类、不同格式、不同布局的业务单据的业务字段的识别后,能够确定标准统一的业务字段的名称。
[0011]在上述第一方面的一种可能的实现中,包括:若未匹配到,在第一业务字段与基准字段或者同义字段中的至少一个符合相似度阈值的情况下,将第一业务字段设置为同义字段。
[0012]即在本申请的实施例中,这里的相似度阈值可以是第一业务字段的文字特征与基准字段或者同义字段的文字特征之间的匹配度。如:使用自然语言处理算法比较第一业务字段的文字特征与基准字段或者同义字段的文字特征之间的匹配度。
[0013]在上述第一方面的一种可能的实现中,同义字段与基准字段的名称不同但含义相同。
[0014]在上述第一方面的一种可能的实现中,同义字段通过与第一单据属于同一业务领域中的第二单据包含的第二业务字段确定。
[0015]即在本申请的实施例中,这里的第二业务字段可以是与第一业务字段名称不同但含义相同的业务字段。
[0016]在上述第一方面的一种可能的实现中,若第一业务字段匹配到基准字段或者同义字段中的至少一个,获取并保存第一业务字段对应的业务内容,包括:
[0017]获取与第一单据相关联的第三单据;
[0018]确定第三单据中与第一业务字段名称相同或者名称不同含义相同的第三字段;
[0019]若第一业务字段对应的业务内容与第三字段的业务内容匹配,保存第一业务字段对应的业务内容;
[0020]若不匹配,提示第一业务字段对应的业务内容。
[0021]通过本申请的第一方面提供的方法,还可以对业务字段的业务内容进行一致性校验,减少了业务员进行人工检验的工作量,提高了物流业务的效率和准确率。
[0022]即在本申请的实施例中,这里的第三单据可以是与第一单据具有业务关联的单据,如:第一单据可以是返回单,第三单据可以是运输委托单,运输委托合同。
[0023]在上述第一方面的一种可能的实现中,第一业务字段与基准字段或者同义字段中的至少一个符合相似度阈值,包括:
[0024]根据第一业务字段对应的文字特征与基准字段或者同义字段中的至少一个对应的文字特征,利用至少一种文字相似度算法,确定第一业务字段与基准字段或者同义字段中的至少一个是否相同或者同义。
[0025]即在本申请的实施例中,文字相似度算法可以是余弦相似度算法。
[0026]在上述第一方面的一种可能的实现中,第一业务字段位于第一单据包含的表格的表头信息。
[0027]在上述第一方面的一种可能的实现中,包括:
[0028]对第一单据包含的表格进行分割,获得行分割结果或列分割结果;
[0029]从行分割结果或列分割结果中,提取第一行分割结果或第一列分割结果作为表头信息;
[0030]从表头信息中识别出所述至少一个第一业务字段。
[0031]即在本申请的实施例中,第一业务字段可以是第一单据中的表格中的业务字段,表头信息可以是表格的第一行或者第一列。
[0032]本申请的第二方面提供了一种可读介质,可读介质上存储有指令,该指令在电子
设备上执行时使电子设备执行权利要求1至8中任一项的单据识别录入方法。
[0033]本申请的第三方面提供了一种电子设备,包括:
[0034]存储器,用于存储由电子设备的一个或多个处理器执行的指令,以及
[0035]处理器,是电子设备的处理器之一,用于执行权利要求1至8中任一项的单据识别录入方法。
附图说明
[0036]图1根据本申请的实施例示出了一种单据识别录入系统的示意图;
[0037]图2根据本申请的实施例示出了一种电子设备的硬件结构示意图;
[0038]图3根据本申请的实施例示出了一种单据识别录入的流程示意图;
[0039]图4根据本申请的实施例示出了一种发货单的格式的示意图;
[0040]图5根据本申请的实施例示出了一种提示未通过完整性校验的单据的示意图。
具体实施方式
[0041]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。为了使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术作进一步地详细描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种单据识别录入方法,用于电子设备,其特征在于,包括:获取第一单据包括的至少一个第一业务字段;确定所述第一业务字段对应的基准字段,以及所述基准字段对应的至少一个同义字段,所述基准字段为所述第一业务字段的对应的业务领域中的统一名称;将所述第一业务字段与所述基准字段以及所述同义字段进行匹配,若所述第一业务字段匹配到所述基准字段或者所述同义字段中的至少一个,获取并保存所述第一业务字段对应的业务内容。2.根据权利要求1所述的方法,其特征在于,包括:若未匹配到,在所述第一业务字段与所述基准字段或者所述同义字段中的至少一个符合相似度阈值的情况下,将所述第一业务字段设置为所述同义字段。3.根据权利要求2所述的方法,其特征在于,所述同义字段与所述基准字段的名称不同但含义相同。4.根据权利要求2所述的方法,其特征在于,所述同义字段通过与所述第一单据属于同一业务领域中的第二单据包含的第二业务字段确定。5.根据权利要求1所述的方法,其特征在于,若所述第一业务字段匹配到所述基准字段或者所述同义字段中的至少一个,获取并保存所述第一业务字段对应的业务内容,包括:获取与所述第一单据相关联的第三单据;确定所述第三单据中与所述第一业务字段名称相同或者名称不同含义相同的第三字段;若所述第一业务字段对应的业务内容与所述第三字...

【专利技术属性】
技术研发人员:李勤英李冰夷
申请(专利权)人:上海欧冶物流股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1