【技术实现步骤摘要】
本专利技术涉及ocr、文本检测、单字检测领域,特别涉及一种基于crnn的文字单字检测方法。
技术介绍
1、ocr(optical character recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。ocr的过程主要包括:图片的预处理,图片文本检测,图片文本识别,文本结构化。
2、crnn是一种文本行识别的方法,主要组成是cnn+rnn+ctc,首先通过cnn对图片进行特征抽取,将图片的宽度方向下采样至原始的1/4,将图片的高度下采样至1,然后后面接rnn进行宽度方向的上下文联系,常用的rnn为blstm。然后使用ctc来监督训练文本行训练。
3、目前对于文字单字分割方法研究较少,但是仍然有些场景需要返回单字的位置,目前返回对于单字的切分通常使用传统方法投影法来实现,但是这种方法需要二值化,受到光照条件的影响较大,鲁棒性较差,也有一些基于深度网络的单字检测的方法,例如craft。但是这种方式
...【技术保护点】
1.一种基于CRNN的文字单字检测方法,其特征在于,包括以下:
【技术特征摘要】
1.一种基于crnn的文字单字检...
【专利技术属性】
技术研发人员:请求不公布姓名,
申请(专利权)人:天翼电子商务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。