一种基于RestNet50的文字识别方法技术

技术编号：41348237 阅读：26 留言：0更新日期：2024-05-20 10:02

本发明专利技术提出了一种基于CTPN和RestNet50的图像敏感文字识别方法，属于图像文字识别领域。具体包括如下步骤：首先，构建用于敏感文字识别检测的图像数据集，其中包括各类敏感文字图像。之后，输入的图像可以通过CTPN网络准确检测出文本区域，将每个文本区域输入到RestNet50网络进行特征提取。使用BiLSTM来捕捉序列中的上下文信息，对每个文本区域的特征序列进行处理。使用CTC层对BiLSTM输出的序列进行文字识别。最终判断输出的文字中是否包含敏感信息。整个方法通过定位文字位置、特征提取、序列处理和不定长文本识别、判断是否包含敏感信息。在广泛采用的文字识别数据集中的实验结果显示，本方法在文字识别准确率上优于其他算法，这为本发明专利技术的有效性提供了有力的验证。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于自然语言处理领域，具体涉及一种基于ctpn和restnet50的图像敏感文字识别方法。

技术介绍

1、在敏感文字识别领域，整合ctpn、resnet50、bilstm以及ctc方法构建出一个全新的文字识别网络框架。这个方法致力于应对敏感信息的复杂语境，为敏感文字的准确辨识提供了全新的解决方案。

2、首先，ctpn作为文本行检测的核心组件，可以精准的定位文字位置。通过端到端的学习方式，ctpn能够生成准确的文本区域框，为后续处理步骤提供了可靠的文本位置信息。

3、其次，引入resnet50以提取图像中文本的语义特征。resnet50通过深度残差结构强大的特征提取能力，可以有效地捕捉到包含文本信息的语义上下文。这为文字的高效辨识提供了强大的支持。

4、接着，通过bilstm网络进行序列建模，进一步加强对文字信息上下文的识别能力。bilstm的双向循环结构使得系统能够更全面地考虑文本序列的前后关系，提高了对不同形式的文字信息的识别精度。

5、然后，引入ctc损失函数完成不定长文字的...

【技术保护点】

1.一种基于CTPN和RestNet50的图像敏感文字识别方法，其特征在于：首先，构建用于敏感文字识别检测的图像数据集，其中包括各类敏感文字图像。之后，输入的图像可以通过CTPN网络准确检测出文本区域，将每个文本区域输入到RestNet50网络进行特征提取。使用BiLSTM来捕捉序列中的上下文信息，对每个文本区域的特征序列进行处理。使用CTC层对BiLSTM输出的序列进行文字识别。最终判断输出的文字中是否包含敏感信息。具体包括如下步骤：

2.根据权利要求1所述的基于CTPN和RestNet50的图像敏感文字识别方法，其特征在于，所述步骤2的具体过程如下：</p>

3.根据...

【技术特征摘要】

1.一种基于ctpn和restnet50的图像敏感文字识别方法，其特征在于：首先，构建用于敏感文字识别检测的图像数据集，其中包括各类敏感文字图像。之后，输入的图像可以通过ctpn网络准确检测出文本区域，将每个文本区域输入到restnet50网络进行特征提取。使用bilstm来捕捉序列中的上下文信息，对每个文本区域的特征序列进行处理。使用ctc层对bilstm输出的序列进行文字识别。最终判断输出的文字中是否包含敏感信...

【专利技术属性】
技术研发人员：郑中华，胡淦，王文仲，
申请(专利权)人：安徽博约信息科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人