【技术实现步骤摘要】
图像文本行检测方法、装置、设备及存储介质
本公开涉及计算机视觉
,具体而言,涉及一种图像文本行检测方法、装置、设备及可读存储介质。
技术介绍
随着深度学习技术在诸多领域的广泛应用,很多基于计算机视觉的相关的应用也迅猛发展。光学文字识别(OpticalCharacterRecognition,OCR)就是其中一个比较典型的代表。整个OCR的处理过程通常包含了三个步骤:提取图像中的文本行,识别图像中的文本行内容,最后对识别出的文本行内容进行结构化处理。其中,文本行检测是整个OCR流程的第一步,检测的质量将直接影响整个OCR的最终结果。一些相关技术中的文本行检测方法包括在二值图像或者灰度图像上进行“行投影”加“列投影”的方式、也有在二值图像上通过分析联通域的方式。这些方法受图像背景与图像质量影响较大,导致在一些复杂背景下,或者在图像质量较差的情况下检测效果比较差,而且需要在检测前知道图像中的文本行的宽度、长度大概范围来进行阈值的设置。另一些相关技术中的基于深度网络的文本行检测方法通过卷积神经网络(Convol ...
【技术保护点】
1.一种图像文本行检测方法,其特征在于,包括:/n获取待检测图像,所述待检测图像包括文本行;/n通过全卷积网络提取所述待检测图像的空间特征获得空间特征图;/n根据所述空间特征图通过第一循环神经网络提取所述待检测图像的水平序列特征获得水平序列特征图;/n根据所述空间特征图通过第二循环神经网络提取所述待检测图像的垂直序列特征获得垂直序列特征图;/n将所述水平序列特征图和所述垂直序列特征图进行合并处理获得合并序列特征图;/n将所述合并序列特征图通过卷积核后进行特征筛选以获得所述文本行。/n
【技术特征摘要】
1.一种图像文本行检测方法,其特征在于,包括:
获取待检测图像,所述待检测图像包括文本行;
通过全卷积网络提取所述待检测图像的空间特征获得空间特征图;
根据所述空间特征图通过第一循环神经网络提取所述待检测图像的水平序列特征获得水平序列特征图;
根据所述空间特征图通过第二循环神经网络提取所述待检测图像的垂直序列特征获得垂直序列特征图;
将所述水平序列特征图和所述垂直序列特征图进行合并处理获得合并序列特征图;
将所述合并序列特征图通过卷积核后进行特征筛选以获得所述文本行。
2.根据权利要求1所述的方法,其特征在于,所述根据所述空间特征图通过第一循环神经网络提取所述待检测图像的水平序列特征获得水平序列特征图,包括:
将所述空间特征图沿水平方向分成多个水平序列,将所述多个水平序列依次连接成水平特征序列;
将所述水平特征序列输入所述第一循环神经网络,通过所述第一循环神经网络提取所述水平序列特征获得所述水平序列特征图。
3.根据权利要求2所述的方法,其特征在于,所述根据所述空间特征图通过第二循环神经网络提取所述待检测图像的垂直序列特征获得垂直序列特征图,包括:
将所述空间特征图沿垂直方向分成多个垂直序列,将所述多个垂直序列依次连接成垂直特征序列;
将所述垂直特征序列输入所述第二循环神经网络,通过所述第二循环神经网络提取所述垂直序列特征获得所述垂直序列特征图。
4.根据权利要求1所述的方法,其特征在于,所述水平序列特征图与所述空间特征图的数据结构相同,所述垂直序列特征图与所述空间特征图的数据结构相同;
所述将所述水平序列特征图和所述垂直序列特征图进行合并处理获得合并序列特征图,包括:
将所述水平序列特征图和所述垂直序列特征图进行叠加处理获得所述合并序列特征图。
5.根据权利要求4所述的方法,其特征在于,所述对将所述合并序列特征图...
【专利技术属性】
技术研发人员:邱君华,李宏宇,李晓林,
申请(专利权)人:同盾控股有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。