一种基于改进的制造技术

技术编号：39751432 阅读：11 留言：0更新日期：2023-12-17 23:49

本发明专利技术涉及

全部详细技术资料下载

【技术实现步骤摘要】
一种基于改进的Transformer的文档伪影去除方法

[0001]本专利技术涉及
OCR

，具体为一种基于改进的
Transformer
的文档伪影去除方法
。

技术介绍

[0002]随着自然语言处理
(NLP)
和自然语言理解
(NLU)
的重要性不断增强，强大的语言模型为优化过时的流程创造了广泛的可能性
。
[0003]现有技术中，这些过时的流程包括处理扫描的文档
、
印刷品和传真等非完全数字化的数据
。
然而，提取这些扫描文档中的文本信息并获得高质量的
OCR
结果并不总是容易的
。
文档扫描过程中可能存在各种错误和质量问题，改进文档质量是一项具有挑战性的任务
。
因此，通常采用纠正提取后文本中的错误的方法来解决这个问题，而不是直接提高文档质量
。
这种方法可以帮助提升自然语言模型的性能，并提高对文档中重要信息的准确提取能力
。
但是，这些方法无法纠正新实体，例如罕见的姓名
、
地址或联系方式
(
电话
、
传真
、
电子邮件地址
)
，而这些实体对于信息提取任务非常重要
。
[0004]为了应对上述问题，一些方法已经提出，例如利用生成对抗网络
(GAN)
或基于卷积层的自动编码器来改善文档中的

【技术保护点】

【技术特征摘要】
1.
一种基于改进的
Transformer
的文档伪影去除方法，其特征在于：所述方法包括如下步骤：
S1、
在
U
‑
Net
网络中引入
Swin Transformer
构成
SU
‑
Net
网络；
S2、
将
SU
‑
Net
网络中的跳跃连接替换为多头交叉注意力连接；
S3、
构建数据集训练改进后的
SU
‑
Net
网络
。2.
根据权利要求1所述的一种基于改进的
Transformer
的文档伪影去除方法，其特征在于：在
U
‑
Net
网络中引入
Swin Transformer
构成
SU
‑
Net
网络的具体操作包括：在
SU
‑
Net
中，使用3×3卷积来获得输入图像浅层特征，通过
U
‑
Net
网络进行特征提取，将
Swin Transform Block
作为基本提取模块来替换
U
‑
Net
中的普通卷积层并获取高级语义信息，使用3×3卷积来恢复重建的图
。3.
根据权利要求2所述的一种...

【专利技术属性】
技术研发人员：刘玉国，段强，宁方刚，姜凯，
申请(专利权)人：山东浪潮科学研究院有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人