自然场景多方向文本检测方法技术

技术编号：12256352 阅读：114 留言：0更新日期：2015-10-28 19:38

本发明专利技术提供自然场景多方向文本检测方法，具体步骤如下：步骤一、边界提升MSER区域提取；在原始MSER算法得到的稳定极值区域成分树上递归的对存在父亲-独子关系且面积变化ΔS不超过的第一阈值的两个区域，依据边界吻合度公式，对其中边界吻合度小的区域进行剔除；步骤二、字符分检树区域分拣；步骤三、字符多层融合形成文本行；对步骤二最终得到分拣出的字符区域集合进行多层融合，依次为膨胀融合层、自由生长层、双射生长层、竞争层，最终生成文本行。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及模式识别、图像处理、人工智能相关技术，属于计算机视觉领域。
技术介绍
自然场景中文本检测因受到语种、尺度、字体、光照、对比度、视角、方向、背景、残缺、模糊、断裂等诸多因素的干扰，检测精度无法达到较高水平。时至今日自然场景中的文本检测仍然没有得到很好的解决，当前的研究主要针对水平方向英文文本的检测，多方向混合语种的检测技术相对滞后，很多检测方法将字符为水平方向作为先验知识，因此在多方向上的文本检测效果不理想（如，，)，同样一些检测方法将语种限制在英文字符上，训练的参数化分类器仅记忆了英文字符的特征，因此在多语言库上的检测结果率较低（如，，)。当前的检测方法主要分为基于窗口和基于连通域两大类。基于窗口的方法提取滑动窗口的纹理、变换域、边界梯度等特征设计分类器进行文字窗口和非文字窗口的识别（如)，也有学者直接将窗口图像作为输入设计深度神经网络进行识别。这类方法能够抓住文字图像高层特征，但计算代价过大，特征的设计非常困难。基于连通域的方法依据图像边界、灰度、颜色等信息获得图像中的区域，然后提取区域的笔画宽度、长宽比、占位比、灰度、颜色、边界等特征设计分类器进行字符区域与非字符区域的识别（如，)，同样很多学者也将整个区域作为卷积神经网络的输入进行训练与识别。该类方法虽然计算速度得到很大提升，但存在误连接、干扰大、虚警高、不具鲁棒性等缺点。检测后期需要完成字符区域的连接与文本行生成，字符的连接方法主要分为两大类，一类是基于启发规则的生长方法（如)，另一类是基于学习的聚合方法（如)。基于启发规则的生长方法通...
<a href="http://www.xjishu.com/zhuanli/55/CN105005764.html" title="自然场景多方向文本检测方法原文来自X技术">自然场景多方向文本检测方法</a>

【技术保护点】
自然场景多方向文本检测方法，其特征在于：具体步骤如下：步骤一、边界提升MSER区域提取；在原始MSER算法得到的稳定极值区域成分树上递归的对存在父亲‑独子关系且面积变化ΔS不超过的第一阈值的两个区域，依据边界吻合度公式，对其中边界吻合度小的区域进行剔除；所述边界吻合度公式为：MatchScore=11+1NΣi=1Nmin{||R(xi,yi)-E(x,y)||}]]>其中：N为区域边界点个数，R(xi,yi)为区域某边界点，E(x,y)为在原始MSER算法上采用Canny边缘检测算子之后得到的Canny边界点集，||·||表示向量的长度运算；步骤二、字符分检树区域分拣；经步骤一中边界提升MSER区域提取后的区域集合，首先经过决策树分类器将区域分为字符区域和非字符区域，非字符区域被直接剔除，字符区域依据边界面积比被分成两部分，其中边界面积比大于第二阈值的区域集合被送入第一随机森林分类器，边界面积比不大于第二阈值的区域集合被送入第二随机森林分类器，两个随机森林分类器识别出的非字符区域都将被剔除，而保留下来的区域经过剪枝分类器进行分类，最终得到分拣出的字符区域集合；步骤三、字符...

【技术特征摘要】

【专利技术属性】
技术研发人员：杨彬，夏思宇，
申请(专利权)人：东南大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人