一种基于RestNet50的文字识别方法技术

技术编号:41348237 阅读:26 留言:0更新日期:2024-05-20 10:02
本发明专利技术提出了一种基于CTPN和RestNet50的图像敏感文字识别方法,属于图像文字识别领域。具体包括如下步骤:首先,构建用于敏感文字识别检测的图像数据集,其中包括各类敏感文字图像。之后,输入的图像可以通过CTPN网络准确检测出文本区域,将每个文本区域输入到RestNet50网络进行特征提取。使用BiLSTM来捕捉序列中的上下文信息,对每个文本区域的特征序列进行处理。使用CTC层对BiLSTM输出的序列进行文字识别。最终判断输出的文字中是否包含敏感信息。整个方法通过定位文字位置、特征提取、序列处理和不定长文本识别、判断是否包含敏感信息。在广泛采用的文字识别数据集中的实验结果显示,本方法在文字识别准确率上优于其他算法,这为本发明专利技术的有效性提供了有力的验证。

【技术实现步骤摘要】

本专利技术属于自然语言处理领域,具体涉及一种基于ctpn和restnet50的图像敏感文字识别方法。


技术介绍

1、在敏感文字识别领域,整合ctpn、resnet50、bilstm以及ctc方法构建出一个全新的文字识别网络框架。这个方法致力于应对敏感信息的复杂语境,为敏感文字的准确辨识提供了全新的解决方案。

2、首先,ctpn作为文本行检测的核心组件,可以精准的定位文字位置。通过端到端的学习方式,ctpn能够生成准确的文本区域框,为后续处理步骤提供了可靠的文本位置信息。

3、其次,引入resnet50以提取图像中文本的语义特征。resnet50通过深度残差结构强大的特征提取能力,可以有效地捕捉到包含文本信息的语义上下文。这为文字的高效辨识提供了强大的支持。

4、接着,通过bilstm网络进行序列建模,进一步加强对文字信息上下文的识别能力。bilstm的双向循环结构使得系统能够更全面地考虑文本序列的前后关系,提高了对不同形式的文字信息的识别精度。

5、然后,引入ctc损失函数完成不定长文字的识别任务。ctc通过本文档来自技高网...

【技术保护点】

1.一种基于CTPN和RestNet50的图像敏感文字识别方法,其特征在于:首先,构建用于敏感文字识别检测的图像数据集,其中包括各类敏感文字图像。之后,输入的图像可以通过CTPN网络准确检测出文本区域,将每个文本区域输入到RestNet50网络进行特征提取。使用BiLSTM来捕捉序列中的上下文信息,对每个文本区域的特征序列进行处理。使用CTC层对BiLSTM输出的序列进行文字识别。最终判断输出的文字中是否包含敏感信息。具体包括如下步骤:

2.根据权利要求1所述的基于CTPN和RestNet50的图像敏感文字识别方法,其特征在于,所述步骤2的具体过程如下:</p>

3.根据...

【技术特征摘要】

1.一种基于ctpn和restnet50的图像敏感文字识别方法,其特征在于:首先,构建用于敏感文字识别检测的图像数据集,其中包括各类敏感文字图像。之后,输入的图像可以通过ctpn网络准确检测出文本区域,将每个文本区域输入到restnet50网络进行特征提取。使用bilstm来捕捉序列中的上下文信息,对每个文本区域的特征序列进行处理。使用ctc层对bilstm输出的序列进行文字识别。最终判断输出的文字中是否包含敏感信...

【专利技术属性】
技术研发人员:郑中华胡淦王文仲
申请(专利权)人:安徽博约信息科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1