一种基于CRNN的文字单字检测方法技术

技术编号:41175301 阅读:19 留言:0更新日期:2024-05-07 22:11
本发明专利技术公开了一种基于CRNN的文字单字检测方法,包括以下:(1)、改进的带检测CRNN模型结构设计;(2)改进的带检测CRNN模型Loss设计。本发明专利技术在CRNN的基础上提出了单字检测模块和CRNN的特征耦合能够在做文本行识别的基础上定位出单字;和CRNN共用大部份基础架构,极大提升了模型的效率,使用1D卷积模拟LSTM的作用,提升了模型并行化,进一步提高了模型的效率;在一定程度上缓解了CRNN使用CTC训练时的对齐问题。

【技术实现步骤摘要】

本专利技术涉及ocr、文本检测、单字检测领域,特别涉及一种基于crnn的文字单字检测方法。


技术介绍

1、ocr(optical character recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。ocr的过程主要包括:图片的预处理,图片文本检测,图片文本识别,文本结构化。

2、crnn是一种文本行识别的方法,主要组成是cnn+rnn+ctc,首先通过cnn对图片进行特征抽取,将图片的宽度方向下采样至原始的1/4,将图片的高度下采样至1,然后后面接rnn进行宽度方向的上下文联系,常用的rnn为blstm。然后使用ctc来监督训练文本行训练。

3、目前对于文字单字分割方法研究较少,但是仍然有些场景需要返回单字的位置,目前返回对于单字的切分通常使用传统方法投影法来实现,但是这种方法需要二值化,受到光照条件的影响较大,鲁棒性较差,也有一些基于深度网络的单字检测的方法,例如craft。但是这种方式需要重新设计一个单独本文档来自技高网...

【技术保护点】

1.一种基于CRNN的文字单字检测方法,其特征在于,包括以下:

【技术特征摘要】

1.一种基于crnn的文字单字检...

【专利技术属性】
技术研发人员:请求不公布姓名
申请(专利权)人:天翼电子商务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1