当前位置: 首页 > 专利查询>中山大学专利>正文

一种基于分层上下文感知交互重构的场景文本消隐方法和系统技术方案

技术编号:44660892 阅读:13 留言:0更新日期:2025-03-19 20:19
本发明专利技术公开了一种基于分层上下文感知交互重构的场景文本消隐方法和系统,方法包括:通过轻量级的共享编码‑分离解码网络进行初步文本定位和文本区域背景重建,预测得到粗略文本掩码和粗略文本擦除图像;使用深度可分离卷积网络对粗略文本掩码进行精细化处理,通过层级掩码解码器对粗略文本掩码进行层级精细化处理;通过U‑Net特征提取器对粗略文本擦除图像进行下采样处理,并根据层级精细掩码逐层学习复杂背景与文本区域的上下文关系,解码出场景文本擦除图像;将原图像与场景文本擦除图像相加,得到最终预测图像。本发明专利技术实施例能够提供更准确的文本位置视觉信息来指导文本区域的重建,实现更好的重建效果,可广泛应用于计算机技术领域。

【技术实现步骤摘要】

本专利技术涉及计算机,尤其涉及一种基于分层上下文感知交互重构的场景文本消隐方法和系统


技术介绍

1、随着计算机视觉技术的快速发展,场景文本擦除已成为该领域中一个重要的研究方向。场景文本擦除的核心任务是从视觉上擦除图像中的文本,同时尽量保持场景背景的完整性和擦除区域的连贯性。此类技术在图像编辑、数据处理、隐私保护等方面具有广泛的应用前景。例如,在图像编辑应用中,去除照片中不需要的文字信息可以使照片更加干净美观;在数据处理方面,自动化的文本擦除技术可以高效地清洗神经网络的训练数据;在隐私保护方面,场景文本擦除技术可以有效去除图像中的敏感信息。然而,场景文本擦除是一项极具挑战的任务,其主要难点集中在两个方面:文本定位的挑战性和背景重建的复杂性。首先,文本定位的挑战性体现在文本语言、文体风格、文本几何布局等多个方面。其中文本语言可能包括不同国家地区的语言,文本的文体风格可能包括不同的字体、大小和颜色,而几何布局则可能涉及长文本、倾斜文本、透视文本等各种形式。这些多样化的样式给文本定位带来了极大的复杂性和难度。其次,背景重建的复杂性主要源于场景背景的纹理结构和遮挡本文档来自技高网...

【技术保护点】

1.一种基于分层上下文感知交互重构的场景文本消隐方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于分层上下文感知交互重构的场景文本消隐方法,其特征在于,所述通过一个轻量级的共享编码-分离解码网络进行初步文本定位和文本区域背景重建,预测得到粗略文本掩码和粗略文本擦除图像,包括以下步骤:

3.根据权利要求1所述的一种基于分层上下文感知交互重构的场景文本消隐方法,其特征在于,所述使用深度可分离卷积网络对所述粗略文本掩码进行精细化处理,进而通过四个层级掩码解码器对所述粗略文本掩码进行层级精细化处理,得到层级精细掩码,包括以下步骤:>

4.根据权利...

【技术特征摘要】

1.一种基于分层上下文感知交互重构的场景文本消隐方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于分层上下文感知交互重构的场景文本消隐方法,其特征在于,所述通过一个轻量级的共享编码-分离解码网络进行初步文本定位和文本区域背景重建,预测得到粗略文本掩码和粗略文本擦除图像,包括以下步骤:

3.根据权利要求1所述的一种基于分层上下文感知交互重构的场景文本消隐方法,其特征在于,所述使用深度可分离卷积网络对所述粗略文本掩码进行精细化处理,进而通过四个层级掩码解码器对所述粗略文本掩码进行层级精细化处理,得到层级精细掩码,包括以下步骤:

4.根据权利要求1所述的一种基于分层上下文感知交互重构的场景文本消隐方法,其特征在于,所述通过u-net特征提取器对所述粗略文本擦除图像进行下采样处理,并根据所述层级精细掩码逐层学习复杂背景与文本区域的上下文关系,解码出场景文本擦除图像,包括以下...

【专利技术属性】
技术研发人员:代朋纹李靖宇温小梦熊智忠
申请(专利权)人:中山大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1