跨场景的票据识别方法、装置、设备及存储介质制造方法及图纸

技术编号：42306871 阅读：16 留言：0更新日期：2024-08-14 15:52

本发明专利技术涉及跨场景的票据识别方法、装置、设备和存储介质，方法包括：将多格式票据数据进行类别集结，得到票据集数据，对票据集数据进行分类提取，得到多场景训练数据；将多场景训练数据导入到预设的训练模型进行跨场景识别训练，得到跨场景识别模型；通过跨场景识别模型对待识别票据进行类别确定，得到待识别票据的票据类型，对待识别票据进行通用场景识别，得到对应的通用场景特征，并对通用场景特征进行类型划分，得到特征类型；依据票据类型和特征类型控制对应的跨场景识别子模型对待识别票据进行字段识别标注，得到对应的票据字段信息。本发明专利技术能够针对跨场景版式进行识别，无需对每个版式定制化开发一个模板。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及跨场景的票据识别的，特别涉及一种跨场景的票据识别方法、装置、设备及存储介质。

技术介绍

1、传统单证识别方法中，通过模板技术，或者单一样式标注来识别特定的票据种类，模板技术只能一个模板对应一个版式，对于通用场景的就需要根据票据类型定制化很多模板，但是供应链企业文件类型很多，对每一个版式定制化开发一个模板，耗时耗力并且在样本量非常大的业务场景下根本无法满足业务需求，且开发周期长。

技术实现思路

1、本专利技术的主要目的为提供一种跨场景的票据识别方法、装置、设备及存储介质，能够针对跨场景版式进行识别，无需对每个版式定制化开发一个模板，还能提高特征精准度。

2、为实现上述目的，本专利技术提供一种跨场景的票据识别方法，包括：

3、将多格式票据数据进行类别集结，得到票据集数据，对所述票据集数据进行分类提取，得到多场景训练数据；

4、将所述多场景训练数据导入到预设的训练模型进行跨场景识别训练，得到跨场景识别模型；

5、通过所述跨场景识别模型对待识别票据进行类别确定，得到所述待识别票据的票据类型，对所述待识别票据进行通用场景识别，得到对应的通用场景特征，并对所述通用场景特征进行类型划分，得到特征类型；

6、依据所述票据类型和所述特征类型控制对应的跨场景识别子模型对所述待识别票据进行字段识别标注，得到对应的票据字段信息。

7、进一步地，多格式票据数据进行类别集结，得到票据集数据，对数据集数据进行分类提取，得到多场景训练数据，包括：

8、对获取到的多格式票据数据依据预设的筛选规则进行初步筛选处理，并剔除筛选过程中识别到的无效数据，得到票据集数据，依据所述票据集数据的功能和用途将所述票据集数据划分为十七种主类别数据，并在每个主类别数据下依据版式细节进一步划分成两种子类别数据；

9、通过预设的标注规则分别对每种主类别数据进行关键字词标注和非关键字段划分，将标注好的主类别数据转换成对应的结构数据集，每种结构数据集包含两种子类别数据，将结构数据集整合成多场景训练数据。

10、进一步地，所述将所述多场景训练数据导入到预设的训练模型进行跨场景识别训练，得到跨场景识别模型，包括：

11、通过所述训练模型对所述多场景训练数据进行基础特征学习训练与提取处理，得到初始识别模型和基础特征；

12、将所述多场景训练数据输入至初始识别模型的宏观分类层中，通过初始识别模型依据多场景训练数据进行主类别识别训练，并根据基础特征在主类识别训练过程中提取所述多场景训练数据的共性特征，将提取到的共性特征存放到初始识别模型的特征共享层中，判断初始识别模型是否符合预设的性能要求，当不符合性能要求时，对初始识别模型进行轮次迭代训练，直到初始识别模型符合性能要求时，将初始识别模型转换为所述跨场景识别模型；

13、基于所述跨场景识别模型的特征共享层构建初始识别子模型，将共性特征填充到初始识别子模型，将所述初始识别子模型与跨场景识别模型进行对应关联，并从关联的所述跨场景识别模型的宏观分类层中调用对应的所述多场景训练数据进行二次细分类型识别训练，得到的跨场景识别子模型结合到所述跨场景识别模型，依据预设的独立验证集对所述跨场景识别模型进行交叉性能验证，当所述跨场景识别模型与所述跨场景识别子模型的识别链路和协同工作性能不符合独立验证集的要求时，对所述跨场景识别模型与所述跨场景识别子模型进行参数调整，直至符合独立验证集的要求。

14、进一步地，所述通过所述跨场景识别模型对待识别票据进行类别确定，得到待识别票据的票据类型，包括：

15、通过所述跨场景识别模型依次提取所述待识别票据的票据字段、票据边缘、票据纹理和票据结构，结合票据纹理和票据结构计算得到结构质感向量，结合票据边缘和票据结构计算得到形状轮廓向量，结合票据字段、结构质感向量和形状轮廓向量计算得到综合特征向量，通过所述跨场景识别模型对综合特征向量进行主类别匹配，得到所述待识别票据的初始票据类型，依据初始票据类型对应预设的类型字段要求对票据字段进行二次复检，当票据字段符合类型字段要求时，初始票据类型确定为所述待识别票据的票据类型。

16、进一步地，所述对待识别票据进行通用场景识别，得到对应的通用场景特征，并对通用场景特征进行类型划分，得到特征类型，包括：

17、通过所述跨场景识别模型对待识别票据进行通用场景识别，得到所述通用场景特征，基于所述票据字段、所述票据边缘、所述票据纹理和所述票据结构对所述通用场景特征进行特征识别计算，得到所述待识别票据的布局特征、安全特征和视觉特征；

18、通过所述跨场景识别模型结合布局特征、安全特征和视觉特征进行进行类型划分，得到所述特征类型。

19、进一步地，依据票据类型和特征类型控制对应的跨场景识别子模型对待识别票据进行字段识别标注，得到对应的票据字段信息，包括：

20、通过所述跨场景识别模型根据所述票据类型调用对应的所述跨场景识别子模型，所述跨场景识别子模型对所述待识别票据进行二次复检，当所述待识别票据符合所述跨场景识别子模型的处理类型时，依据所述特征类型对所述待识别票据进行细粒度分析，定位到所述待识别票据的关键字段信息位置，通过所述跨场景识别子模型应用字符识别技术对关键字段信息位置提取目标字段内容，将关键字段信息位置和目标字段内容进行结构化标注，得到票据字段信息；

21、其中，在细粒度分析过程和提取目标字段内容过程中，通过跨场景识别子模型结合所述票据类型和已知的字段的上下文信息进行逻辑校验和信息补充。

22、本专利技术还提供一种跨场景的票据识别装置，包括：

23、提取模块，所述提取模块用于将多格式票据数据进行类别集结，得到票据集数据，对票据集数据进行分类提取，得到多场景训练数据；

24、训练模块，所述训练模块用于将所述多场景训练数据导入到预设的训练模型进行跨场景识别训练，得到跨场景识别模型；

25、处理模块，所述处理模块用于通过所述跨场景识别模型对待识别票据进行类别确定，得到待识别票据的票据类型，对待识别票据进行通用场景识别，得到对应的通用场景特征，并对通用场景特征进行类型划分，得到特征类型；

26、控制模块，所述控制模块用于依据票据类型和特征类型控制对应的跨场景识别子模型对待识别票据进行字段识别标注，得到对应的票据字段信息。

27、本专利技术还提供一种跨场景的票据识别设备，包括：

28、存储器，用于存储程序；

29、处理器，用于执行所述程序，实现上述任意一项所述的一种跨场景的票据识别方法的各个步骤。

30、本专利技术还提供一种存储介质，存储有计算机指令，所述计算机指令用于使计算机执行上述任一项所述的方法。

31、本专利技术提供的，具有以下有益效果：

32、通过对多格式票据数据进行集结和分类提取，生成的多场景训练数据覆盖了广泛的格式和样式，使得本文档来自技高网...

【技术保护点】

1.一种跨场景的票据识别方法，其特征在于，包括：

2.根据权利要求1所述的跨场景的票据识别方法，其特征在于，将多格式票据数据进行类别集结，得到票据集数据，对数据集数据进行分类提取，得到多场景训练数据，包括：

3.根据权利要求1所述的跨场景的票据识别方法，其特征在于，所述将所述多场景训练数据导入到预设的训练模型进行跨场景识别训练，得到跨场景识别模型，包括：

4.根据权利要求1所述的跨场景的票据识别方法，其特征在于，所述通过所述跨场景识别模型对待识别票据进行类别确定，得到待识别票据的票据类型，包括：

5.根据权利要求4所述的跨场景的票据识别方法，其特征在于，所述对待识别票据进行通用场景识别，得到对应的通用场景特征，并对通用场景特征进行类型划分，得到特征类型，包括：

6.根据权利要求1所述的跨场景的票据识别方法，其特征在于，依据票据类型和特征类型控制对应的跨场景识别子模型对待识别票据进行字段识别标注，得到对应的票据字段信息，包括：

7.一种跨场景的票据识别装置，其特征在于，包括：

8.一种跨场景的票据识别设备，其特征在于，包括：

9.一种存储介质，其特征在于，存储有计算机指令，所述计算机指令用于使计算机执行根据权利要求1至6任一项所述的方法。

...

【技术特征摘要】

1.一种跨场景的票据识别方法，其特征在于，包括：

5.根据权利要求4所述的...

【专利技术属性】
技术研发人员：苏治，丁军，张煜，陶旭光，喻祥，范耀军，
申请(专利权)人：优顶特技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人