一种基于CRNN的文字单字检测方法技术

技术编号：41175301 阅读：19 留言：0更新日期：2024-05-07 22:11

本发明专利技术公开了一种基于CRNN的文字单字检测方法，包括以下：(1)、改进的带检测CRNN模型结构设计；(2)改进的带检测CRNN模型Loss设计。本发明专利技术在CRNN的基础上提出了单字检测模块和CRNN的特征耦合能够在做文本行识别的基础上定位出单字；和CRNN共用大部份基础架构，极大提升了模型的效率，使用1D卷积模拟LSTM的作用，提升了模型并行化，进一步提高了模型的效率；在一定程度上缓解了CRNN使用CTC训练时的对齐问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及ocr、文本检测、单字检测领域，特别涉及一种基于crnn的文字单字检测方法。

技术介绍

1、ocr(optical character recognition，光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程。ocr的过程主要包括：图片的预处理，图片文本检测，图片文本识别，文本结构化。

2、crnn是一种文本行识别的方法，主要组成是cnn+rnn+ctc，首先通过cnn对图片进行特征抽取，将图片的宽度方向下采样至原始的1/4，将图片的高度下采样至1，然后后面接rnn进行宽度方向的上下文联系，常用的rnn为blstm。然后使用ctc来监督训练文本行训练。

3、目前对于文字单字分割方法研究较少，但是仍然有些场景需要返回单字的位置，目前返回对于单字的切分通常使用传统方法投影法来实现，但是这种方法需要二值化，受到光照条件的影响较大，鲁棒性较差，也有一些基于深度网络的单字检测的方法，例如craft。但是这种方式...

【技术保护点】

1.一种基于CRNN的文字单字检测方法，其特征在于，包括以下：

【技术特征摘要】

1.一种基于crnn的文字单字检...

【专利技术属性】
技术研发人员：请求不公布姓名，
申请(专利权)人：天翼电子商务有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人