当前位置: 首页 > 专利查询>重庆大学专利>正文

海关M2M场景下的非结构化随附单据信息提取方法及系统技术方案

技术编号:41623254 阅读:17 留言:0更新日期:2024-06-13 02:23
本发明专利技术涉及OCR信息提取技术领域,具体公开了一种海关M2M场景下的非结构化随附单据信息提取方法及系统,其基于增强型MobileNet‑V1网络和预训练的SVTR网络构建了基准模型,并构建了该基准模型的孪生模型,从而对该基准模型和孪生模型采用GTC训练策略及基于互学习的知识蒸馏优化方法进行训练,训练后的基准模型或孪生模型能够准确地提取海关非结构化随附单据中的编码类字段、字符类字段和数值类字段,显著提升了海关M2M场景下的信息提取准确率和结果置信度。另外,本发明专利技术还基于知识图谱提出了对模型识别结果的后处理方法,以对OCR识别结果进行校正校验,以进一步提升识别准确率。

【技术实现步骤摘要】

本专利技术涉及ocr信息提取,尤其涉及海关m2m场景下的非结构化随附单据信息提取方法及系统。


技术介绍

1、海关作为国家边境的第一道防线,承担着维护国家边境安全的重要责任,海关对于通关文件的核查是确保进出口业务合规性的关键步骤。海关通关业务会涉及到多种类型的单据,即海关非结构化随附单据(cuad,customs unstructured accompanyingdocuments)。在m2m(machine to machine,终端对终端)的无人、无监督的场景下提取从海关非结构化随附单据中的关键信息,对于提升海关的风险甄别能力、监控国家潜在的安全威胁以及维护国家安全稳定等方面都具有重要的战略意义和现实价值。尽管海关非结构化随附单据具有模板和格式规范,但仍具有图像质量参差不齐、内容复杂多样等特点。此外,m2m的应用场景还对单据字段提取的置信度和准确率提出了较高要求。尽管目前ocr(optical character recognition,光学字符识别)技术的发展支持了海关非结构化随附单据中的信息提取,但现有的主流ocr技术主要把m2h(machine t本文档来自技高网...

【技术保护点】

1.海关M2M场景下的非结构化随附单据信息提取方法,其特征在于,包括步骤:

2.根据权利要求1所述的海关M2M场景下的非结构化随附单据信息提取方法,其特征在于,在所述步骤S3中,采用GTC训练策略对所述基准模型进行训练所采用的损失函数LGTC为:

3.根据权利要求2所述的海关M2M场景下的非结构化随附单据信息提取方法,其特征在于:所述SVTR网络具有3个阶段,阶段1和阶段2是融合模块和合并模块的组合,阶段3是融合模块和和汇合模块的组合;其中,融合模块包含两种不同感受野的混合模块,即局部融合和全局融合;局部融合与卷积操作类似,能够感知预定义感受野内字符组件的相关性,...

【技术特征摘要】

1.海关m2m场景下的非结构化随附单据信息提取方法,其特征在于,包括步骤:

2.根据权利要求1所述的海关m2m场景下的非结构化随附单据信息提取方法,其特征在于,在所述步骤s3中,采用gtc训练策略对所述基准模型进行训练所采用的损失函数lgtc为:

3.根据权利要求2所述的海关m2m场景下的非结构化随附单据信息提取方法,其特征在于:所述svtr网络具有3个阶段,阶段1和阶段2是融合模块和合并模块的组合,阶段3是融合模块和和汇合模块的组合;其中,融合模块包含两种不同感受野的混合模块,即局部融合和全局融合;局部融合与卷积操作类似,能够感知预定义感受野内字符组件的相关性,提取各字符间的局部特征;合并模块会对融合模块提取到的特征向量进行高度方向上的下采样,输出特征向量的高度为原来的通道数为原来的2倍;在阶段3中,合并模块被替换成了汇合模块,通过该汇合模块,字符组件进一步被压缩成特征序列,在此特征序列中,每个特征都是一个长度为d3的向量。

4.根据权利要求3所述的海关m2m场景下的非结构化随附单据信息提取方法,其特征在于,在所述步骤s4中,采用gtc训练策略及基于互学习的知识蒸馏优化方法对所述基准模型和所述孪生模型进行训练所采用的损失函数ltrain为:

5.根据权利要求4...

【专利技术属性】
技术研发人员:田逢春刘睿龙林英撑张玲王浩臣吕迪
申请(专利权)人:重庆大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1