【技术实现步骤摘要】
一种基于改进的Transformer的文档伪影去除方法
[0001]本专利技术涉及
OCR
,具体为一种基于改进的
Transformer
的文档伪影去除方法
。
技术介绍
[0002]随着自然语言处理
(NLP)
和自然语言理解
(NLU)
的重要性不断增强,强大的语言模型为优化过时的流程创造了广泛的可能性
。
[0003]现有技术中,这些过时的流程包括处理扫描的文档
、
印刷品和传真等非完全数字化的数据
。
然而,提取这些扫描文档中的文本信息并获得高质量的
OCR
结果并不总是容易的
。
文档扫描过程中可能存在各种错误和质量问题,改进文档质量是一项具有挑战性的任务
。
因此,通常采用纠正提取后文本中的错误的方法来解决这个问题,而不是直接提高文档质量
。
这种方法可以帮助提升自然语言模型的性能,并提高对文档中重要信息的准确提取能力
。
但是,这些方法无法纠正新实体,例如罕见的姓名
、
地址或联系方式
(
电话
、
传真
、
电子邮件地址
)
,而这些实体对于信息提取任务非常重要
。
[0004]为了应对上述问题,一些方法已经提出,例如利用生成对抗网络
(GAN)
或基于卷积层的自动编码器来改善文档中的
【技术保护点】
【技术特征摘要】
1.
一种基于改进的
Transformer
的文档伪影去除方法,其特征在于:所述方法包括如下步骤:
S1、
在
U
‑
Net
网络中引入
Swin Transformer
构成
SU
‑
Net
网络;
S2、
将
SU
‑
Net
网络中的跳跃连接替换为多头交叉注意力连接;
S3、
构建数据集训练改进后的
SU
‑
Net
网络
。2.
根据权利要求1所述的一种基于改进的
Transformer
的文档伪影去除方法,其特征在于:在
U
‑
Net
网络中引入
Swin Transformer
构成
SU
‑
Net
网络的具体操作包括:在
SU
‑
Net
中,使用3×3卷积来获得输入图像浅层特征,通过
U
‑
Net
网络进行特征提取,将
Swin Transform Block
作为基本提取模块来替换
U
‑
Net
中的普通卷积层并获取高级语义信息,使用3×3卷积来恢复重建的图
。3.
根据权利要求2所述的一种...
【专利技术属性】
技术研发人员:刘玉国,段强,宁方刚,姜凯,
申请(专利权)人:山东浪潮科学研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。