【技术实现步骤摘要】
本专利技术属于自然语言处理领域,具体涉及一种基于ctpn和restnet50的图像敏感文字识别方法。
技术介绍
1、在敏感文字识别领域,整合ctpn、resnet50、bilstm以及ctc方法构建出一个全新的文字识别网络框架。这个方法致力于应对敏感信息的复杂语境,为敏感文字的准确辨识提供了全新的解决方案。
2、首先,ctpn作为文本行检测的核心组件,可以精准的定位文字位置。通过端到端的学习方式,ctpn能够生成准确的文本区域框,为后续处理步骤提供了可靠的文本位置信息。
3、其次,引入resnet50以提取图像中文本的语义特征。resnet50通过深度残差结构强大的特征提取能力,可以有效地捕捉到包含文本信息的语义上下文。这为文字的高效辨识提供了强大的支持。
4、接着,通过bilstm网络进行序列建模,进一步加强对文字信息上下文的识别能力。bilstm的双向循环结构使得系统能够更全面地考虑文本序列的前后关系,提高了对不同形式的文字信息的识别精度。
5、然后,引入ctc损失函数完成不定长文字的
...【技术保护点】
1.一种基于CTPN和RestNet50的图像敏感文字识别方法,其特征在于:首先,构建用于敏感文字识别检测的图像数据集,其中包括各类敏感文字图像。之后,输入的图像可以通过CTPN网络准确检测出文本区域,将每个文本区域输入到RestNet50网络进行特征提取。使用BiLSTM来捕捉序列中的上下文信息,对每个文本区域的特征序列进行处理。使用CTC层对BiLSTM输出的序列进行文字识别。最终判断输出的文字中是否包含敏感信息。具体包括如下步骤:
2.根据权利要求1所述的基于CTPN和RestNet50的图像敏感文字识别方法,其特征在于,所述步骤2的具体过程如下:<
...【技术特征摘要】
1.一种基于ctpn和restnet50的图像敏感文字识别方法,其特征在于:首先,构建用于敏感文字识别检测的图像数据集,其中包括各类敏感文字图像。之后,输入的图像可以通过ctpn网络准确检测出文本区域,将每个文本区域输入到restnet50网络进行特征提取。使用bilstm来捕捉序列中的上下文信息,对每个文本区域的特征序列进行处理。使用ctc层对bilstm输出的序列进行文字识别。最终判断输出的文字中是否包含敏感信...
【专利技术属性】
技术研发人员:郑中华,胡淦,王文仲,
申请(专利权)人:安徽博约信息科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。