结构化文本检测方法和系统技术方案

技术编号:14348081 阅读:89 留言:0更新日期:2017-01-04 18:41
本申请公开了结构化文本检测方法和系统,其中所述方法包括:将待检测结构化文本图片及一组文字区域模板输入训练好的卷积神经网络;通过所述卷积神经网络的处理得到所述待检测结构化文本图片的一组待检测区域的实际位置;其中,所述一组文字区域模板中的每一个的位置为与所述待检测结构化文本图片同类的多个结构化文本图片中相应文字区域的位置的平均值;及所述卷积神经网络将所述一组文字区域模板的位置作为所述待检测结构化文本图片的一组待检测区域。本发明专利技术在保证检测准确度的同时使得计算量尽可能小,大大提高了结构化文本检测的效率。

【技术实现步骤摘要】

本申请涉及图片处理领域,尤其涉及一种结构化文本检测方法和系统
技术介绍
结构化文本是指布局结构基本固定的文本,例如身份证、护照、机动车驾驶证、票据等。在数字化时代,人们为了将这些信息录入计算机,往往需要手动打字,花费大量的时间。为了节省时间,人们开始采用将证件拍成图片,再利用计算机视觉技术从图片中自动获取文本的方法。这种方法一般分为三步:第一,将图片中的所有结构化文本作为一个整体进行截取并转正,使之充满整个图片,截取使得去除背景区域,转正使得歪斜的图片变正;第二,检测所有包含文本信息的区域;第三,对被检测出的区域进行文字识别,获取文本信息。其中,第二步,即结构化文本的检测,在整个结构化文本信息获取的过程中占有重要地位。目前结构化文本的检测一般借助于通用物体检测的方法,如基于卷积神经网络的RegionProposalNetwork(RPN),它根据深度卷积神经网络输出的卷积特征图上每一个位置的信息计算这个位置的对应的锚(anchors)的分类分数和调整量,根据分类分数确定对应位置是否有待检测文本存在,通过调整量计算对应文本的位置,即上下左右四个方向的边界坐标。最后还需要利用非最大值本文档来自技高网...
结构化文本检测方法和系统

【技术保护点】
一种结构化文本检测方法,其特征在于,所述方法包括:将待检测结构化文本图片及一组文字区域模板输入训练好的卷积神经网络;通过所述卷积神经网络的处理得到所述待检测结构化文本图片的一组待检测区域的实际位置;其中,所述一组文字区域模板中的每一个的位置为与所述待检测结构化文本图片同类的多个结构化文本图片中相应文字区域的位置的平均值;及所述卷积神经网络将所述一组文字区域模板的位置作为所述待检测结构化文本图片的一组待检测区域。

【技术特征摘要】
1.一种结构化文本检测方法,其特征在于,所述方法包括:将待检测结构化文本图片及一组文字区域模板输入训练好的卷积神经网络;通过所述卷积神经网络的处理得到所述待检测结构化文本图片的一组待检测区域的实际位置;其中,所述一组文字区域模板中的每一个的位置为与所述待检测结构化文本图片同类的多个结构化文本图片中相应文字区域的位置的平均值;及所述卷积神经网络将所述一组文字区域模板的位置作为所述待检测结构化文本图片的一组待检测区域。2.根据权利要求1所述的方法,其特征在于,所述卷积神经网络进行如下处理以得到所述待检测结构化文本图片的一组待检测区域的实际位置:对所述待检测结构化文本图片进行处理获得其卷积特征图;以所述一组文字区域模板的位置作为所述待检测结构化文本图片的一组待检测区域对所述卷积特征图进行兴趣区域池化操作,然后经过全连接层输出所述待检测结构化文本图片的每一待检测区域对应的分类分数和位置调整值;根据所述分类分数确定所述每一待检测区域是否有文字;在确定一待检测区域有文字时,根据该确定有文字的待检测区域的位置调整值调整该确定有文字的待检测区域的坐标值,得到该确定有文字的待检测区域的实际位置。3.根据权利要求1所述的方法,其特征在于,所述将待检测结构化文本图片及一组文字区域模板输入训练好的卷积神经网络之前,所述方法还包括:获取用于训练所述卷积神经网络的所述多个结构化文本图片中的每一图片的所有文字区域的位置;根据所述多个结构化文本图片中的相应文字区域的位置的平均值确定所述文字区域对应的文字区域模板。4.根据权利要求1或3所述的方法,其特征在于,所述文字区域模板的位置通过相应文字区域的中心坐标、宽度及长度确定。5.根据权利要求2所述的方法,其特征在于,所述根据所述分类分数确定所述每一待检测区域是否有文字包括:将每一待检测区域对应的分类分数接Softmax层;在一待检测区域的分类分数大于预设阈值时确定该待检测区域有文字。6.根据权利要求4所述的方法,其特...

【专利技术属性】
技术研发人员:向东来夏炎
申请(专利权)人:北京市商汤科技开发有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1