System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于Transformer的单据处理方法、设备及介质技术_技高网

一种基于Transformer的单据处理方法、设备及介质技术

技术编号:40580358 阅读:7 留言:0更新日期:2024-03-06 17:23
本申请提供了一种基于Transformer的单据处理方法、设备及介质,属于深度学习技术领域。该方法采集单据提交服务器的已审批单据数据;确定各已审批单据数据对应的审批意见标签,以通过各审批意见标签,对各已审批单据数据进行分类标记。将各单据类别的已审批单据数据对应的单据文本进行分割,以得到各已审批单据数据对应的单据字段集合。将各单据字段集合对应的单据类别作为训练标签,分别将各单据字段集合输入Transformer模型的编码器,以对编码器进行训练。获取来自单据提交服务器的待审批单据数据。将待审批单据数据输入训练完成的编码器,以确定待审批单据数据对应的单据类别,根据单据类别,对待审批单据数据进行审批。

【技术实现步骤摘要】

本申请涉及深度学习,尤其涉及一种基于transformer的单据处理方法、设备及介质。


技术介绍

1、在许多企业中,单据管理是一个重要的业务流程,涉及到销售订单、采购订单、发票、合同等多种类型的单据。有效地分类这些单据对于企业的正常运营至关重要。

2、目前,对于单据分类,目前主要依靠人工手动完成,比如手动输入单据类别或选定预置的分类标签。这种分类方式过于耗费时间成本及人力资源,且随着单据内容的不断扩展,手动分类的操作越来越繁琐,容易出现分类出错问题,影响后续单据处理流程。


技术实现思路

1、本申请实施例提供了一种基于transformer的单据处理方法、设备及介质,用于解决单据分类过于依赖人工,单据分类所耗的时间成本、人力成本较高,且容易产生单据分类出错,影响单据处理的问题。

2、一方面,本申请实施例提供了一种基于transformer的单据处理方法,该方法包括:

3、采集单据提交服务器的若干已审批单据数据;

4、确定各所述已审批单据数据对应的审批意见标签,以通过各所述审批意见标签,对各所述已审批单据数据进行分类标记;所述审批意见标签用于表征所述已审批单据数据对应的预设单据类别;

5、分别将各单据类别的所述已审批单据数据对应的单据文本进行分割,以得到各所述已审批单据数据对应的单据字段集合;

6、将各所述单据字段集合对应的所述单据类别作为训练标签,并分别将各所述单据字段集合输入预设transformer模型的编码器,以对所述编码器进行训练;其中,所述输入预设transformer模型的编码器中的各所述单据字段集合不存在位置编码;

7、获取来自所述单据提交服务器的待审批单据数据;

8、将所述待审批单据数据输入训练完成的所述编码器,以确定所述待审批单据数据对应的所述单据类别,并根据所述单据类别,对所述待审批单据数据进行审批。

9、在本申请的一种实现方式中,将各所述单据字段集合对应的所述单据类别作为训练标签,并分别将各所述单据字段集合输入预设transformer模型的编码器,以对所述编码器进行训练,具体包括:

10、以所述单据类别为训练标签,生成无位置编码的所述单据字段集合对应的字段矩阵,并输入待训练的所述编码器的输入层;其中,所述字段矩阵包括所述单据字段集合中各单据字段向量;所述单据字段集合与所述已审批单据数据一一对应;

11、通过所述编码器的编码层,对各所述字段矩阵进行编码处理;所述编码层包括多头自注意力机制、前馈神经网络层;

12、通过池化层及全连接层,将编码处理后的各所述字段矩阵映射到单据类别空间,以得到单据类别矩阵;

13、通过预设归一化指数函数,确定所述单据类别矩阵对应的分类概率分布,以根据所述分类概率分布,确定所述单据字段集合对应的训练单据类别;

14、基于所述训练单据类别、所述训练标签及相应的损失函数值,确定所述编码器是否训练完成,以对所述编码器进行训练,直至所述损失函数值小于预设阈值。

15、在本申请的一种实现方式中,将所述待审批单据数据输入训练完成的所述编码器之后,所述方法还包括:

16、通过所述编码器,确定所述待审批单据数据对应的类别特征信息;

17、将所述类别特征信息与各所述单据类别对应的类别特征信息集合匹配,以基于预设匹配条件,确定所述类别特征信息是否存在匹配的单据类别;其中,所述匹配条件用于确定所述类别特征信息与各所述列表特征信息集合的相似程度;

18、若存在,输出所述待审批单据数据对应的所述单据类别;

19、否则,根据所述类别特征信息,更新相应的单据类别集合;所述单据类别集合至少包括单据类别标识、与所述单据类别标识对应的单据。

20、在本申请的一种实现方式中,所述方法还包括:

21、在确定所述待审批单据数据对应的所述单据类别的情况下,将所述待审批单据数据添加至与所述单据类别对应的单据类别集合。

22、在本申请的一种实现方式中,对所述待审批单据数据进行审批,具体包括:

23、根据所述待审批单据数据对应的所述单据类别,从预设数据库,匹配相应的审批规则列表;其中,所述审批规则列表基于与若干所述已审批单据数据对应的审批记录得到;所述审批记录包括对所述已审批单据数据中各属性值的审批结果;

24、根据所述审批规则列表,确定所述待审批单据数据的各属性值是否满足审批条件,以对所述待审批单据数据进行审批。

25、在本申请的一种实现方式中,根据所述审批规则列表,确定所述待审批单据数据的各属性值是否满足审批条件,以对所述待审批单据数据进行审批,具体包括:

26、确定所述待审批单据数据的各所述属性值中关键属性值;

27、根据所述关键属性值及所述审批规则列表,确定与所述关键属性值对应的属性值序列;

28、将所述属性值序列与所述待审批单据数据的各所述属性值匹配,以确定所述待审批单据数据的各属性值是否满足审批条件,以对所述待审批单据数据进行审批。

29、在本申请的一种实现方式中,所述方法还包括:

30、实时获取各所述单据类别对应的所述已审批单据数据的审批意见;

31、根据各所述审批意见及预先训练的循环神经网络模型,生成所述审批规则列表。

32、在本申请的一种实现方式中,将所述待审批单据数据输入训练完成的所述编码器之后,所述方法还包括:

33、确定所述待审批单据数据的各属性值是否满足预设填写条件;

34、若不满足,生成驳回提示信息,并发送至相应的用户终端;所述驳回提示信息包括声音信息、文本信息。

35、另一方面,本申请实施例还提供了一种基于transformer的单据处理设备,所述设备包括:

36、至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:

37、采集单据提交服务器的若干已审批单据数据;

38、确定各所述已审批单据数据对应的审批意见标签,以通过各所述审批意见标签,对各所述已审批单据数据进行分类标记;所述审批意见标签用于表征所述已审批单据数据对应的预设单据类别;

39、分别将各单据类别的所述已审批单据数据对应的单据文本进行分割,以得到各所述已审批单据数据对应的单据字段集合;

40、将各所述单据字段集合对应的所述单据类别作为训练标签,并分别将各所述单据字段集合输入预设transformer模型的编码器,以对所述编码器进行训练;其中,所述输入预设transformer模型的编码器中的各所述单据字段集合不存在位置编码;

41、获取来自所述单据提交服务器的待审批单据数据;

42、将所述待审批单据数据本文档来自技高网...

【技术保护点】

1.一种基于Transformer的单据处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种基于Transformer的单据处理方法,其特征在于,将各所述单据字段集合对应的所述单据类别作为训练标签,并分别将各所述单据字段集合输入预设Transformer模型的编码器,以对所述编码器进行训练,具体包括:

3.根据权利要求1所述的一种基于Transformer的单据处理方法,其特征在于,将所述待审批单据数据输入训练完成的所述编码器之后,所述方法还包括:

4.根据权利要求1所述的一种基于Transformer的单据处理方法,其特征在于,所述方法还包括:

5.根据权利要求1所述的一种基于Transformer的单据处理方法,其特征在于,对所述待审批单据数据进行审批,具体包括:

6.根据权利要求5所述的一种基于Transformer的单据处理方法,其特征在于,根据所述审批规则列表,确定所述待审批单据数据的各属性值是否满足审批条件,以对所述待审批单据数据进行审批,具体包括:

7.根据权利要求5所述的一种基于Transformer的单据处理方法,其特征在于,所述方法还包括:

8.根据权利要求1所述的一种基于Transformer的单据处理方法,其特征在于,将所述待审批单据数据输入训练完成的所述编码器之后,所述方法还包括:

9.一种基于Transformer的单据处理设备,其特征在于,所述设备包括:

10.一种基于Transformer的单据处理非易失性计算机存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令能够执行如上述权利要求1-8任一项所述的一种基于Transformer的单据处理方法。

...

【技术特征摘要】

1.一种基于transformer的单据处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种基于transformer的单据处理方法,其特征在于,将各所述单据字段集合对应的所述单据类别作为训练标签,并分别将各所述单据字段集合输入预设transformer模型的编码器,以对所述编码器进行训练,具体包括:

3.根据权利要求1所述的一种基于transformer的单据处理方法,其特征在于,将所述待审批单据数据输入训练完成的所述编码器之后,所述方法还包括:

4.根据权利要求1所述的一种基于transformer的单据处理方法,其特征在于,所述方法还包括:

5.根据权利要求1所述的一种基于transformer的单据处理方法,其特征在于,对所述待审批单据数据进行审批,具体包括:

6.根据权利要求5...

【专利技术属性】
技术研发人员:杨斌徐同明马士中王金丽任聪唐昌明
申请(专利权)人:浪潮通用软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1