对图片进行文本检测的方法及装置制造方法及图纸

技术编号：14869575 阅读：179 留言：0更新日期：2017-03-21 01:35

本发明专利技术适用于计算机技术领域，提供了对图片进行文本检测的方法及装置，包括：获取进行文本检测的图片；将所述图片输入全卷积网络的第一层，在所述第一层中基于文本区域的序列特征，检测出所述图片中的文本区域；将所述文本区域输入到所述全卷积网络的第二层，在所述第二层中基于文本中间线的监督分类器，将所述文本区域分解为独立的文本行区域输出，所述文本中间线的区域由高斯分布的函数定义。本发明专利技术基于两层级联式的全卷积网络，对图片中的文本行进行提取，不仅充分节省了重叠区域之间的计算资源，而且利用了文本更高层的序列特征作为监督信息，提高了文本检测算法的鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于计算机
，尤其涉及对图片进行文本检测的方法及装置。
技术介绍
目前，对图片进行文本检测的算法主要分为两类：基于滑动窗口的方法和基于连通区域的方法。基于滑动窗口的方法是通过一个大小可变的滑动子窗口扫描一张图片所有可能的位置，来检测文本信息，其利用一个训练好的分类器来判别窗口内是否有文本信息；基于连通区域的方法首先通过一个底层的滤波器快速分割文本和非文本像素，然后把具有相似属性的文本像素连通起来构成文本成分，笔画宽度转化(SWT)算法和最稳定极值区域(MSREs)算法是此类方法的代表。然而，上述方法的分类网络采用全连接层，丢失了文本区域的位置信息。
技术实现思路
有鉴于此，本专利技术实施例提供了对图片进行文本检测的方法及装置，以解决现有技术会丢失文本区域的位置信息的问题。第一方面，提供了一种对图片进行文本检测的方法，包括：获取进行文本检测的图片；将所述图片输入全卷积网络的第一层，在所述第一层中基于文本区域的序列特征，检测出所述图片中的文本区域；将所述文本区域输入到所述全卷积网络的第二层，在所述第二层中基于文本中间线的监督分类器，将所述文本区域分解为独立的文本行区域输出，所述文本中间线的区域由高斯分布的函数定义。另一方面，提供了一种对图片进行文本检测的装置，包括：获取单元，用于获取进行文本检测的图片；第一处理单元，用于将所述图片输入全卷积网络的第一层，在所述第一层...

【技术保护点】
一种对图片进行文本检测的方法，其特征在于，包括：获取进行文本检测的图片；将所述图片输入全卷积网络的第一层，在所述第一层中基于文本区域的序列特征，检测出所述图片中的文本区域；将所述文本区域输入到所述全卷积网络的第二层，在所述第二层中基于文本中间线的监督分类器，将所述文本区域分解为独立的文本行区域输出，所述文本中间线的区域由高斯分布的函数定义。

【技术特征摘要】
1.一种对图片进行文本检测的方法，其特征在于，包括：
获取进行文本检测的图片；
将所述图片输入全卷积网络的第一层，在所述第一层中基于文本区域的序
列特征，检测出所述图片中的文本区域；
将所述文本区域输入到所述全卷积网络的第二层，在所述第二层中基于文
本中间线的监督分类器，将所述文本区域分解为独立的文本行区域输出，所述
文本中间线的区域由高斯分布的函数定义。
2.如权利要求1所述的方法，其特征在于，所述在所述第一层中基于文本
区域的序列特征，将文本区域和非文本区域的二分类函数作为误差函数，检测
出所述图片中的文本区域包括：
采用3*7、7*3以及3*3的卷积核分别对应不同方向的所述序列特征。
3.如权利要求2所述的方法，其特征在于，所述在所述第一层中基于文本
区域的序列特征，将文本区域和非文本区域的二分类函数作为误差函数，检测
出所述图片中的文本区域还包括：
对特征图像进行多种填补。
4.如权利要求1所述的方法，其特征在于，所述在所述第一层中基于文本
区域的序列特征，将文本区域和非文本区域的二分类函数作为误差函数，检测
出所述图片中的文本区域包括：
将pool-5特征上采样到的和pool-4同样大小的特征进行...

【专利技术属性】
技术研发人员：乔宇，黄韡林，贺通，
申请(专利权)人：中国科学院深圳先进技术研究院，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人