图像中文本区域自动定位方法和系统技术方案

技术编号：2931395 阅读：276 留言：0更新日期：2012-04-11 18:40

公开了一种用于在数字图像中自动定位文本区域的系统，该系统包括：转换单元（１５０；１６０），用于把输入数字图像转换为二值图像；定位单元（１７０），被应用于二值图像以定位可能文本区域；以及选择单元（１８０），用于选择由定位单元（１７０）高亮显示的实际文本区域。定位单元（１７０）有利地设置有用于向二值图像应用至少一个形态学筛选器的装置，该二值图像是通过将数字图像转换为二值图像而获得的。选择单元（１８０）执行灰度级强度细分方法，该灰度级强度细分方法被应用于由转换单元（１５０；１６０）中包括的处理单元（１６０）提供的图像。（*该技术在2023年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像中文本区域的自动定位方法和系统。
技术介绍
有很多论文，例如Ohya，J.，Shio，A.，Akomatsu，S.的论文(题目“Recognizing characters in scene images”，发表于IEEE Trans.On PAMI，Vol.16，No.2，pp.214-220，February 1994)，对关于自动识别数字图像中的字符的工作进行了描述。这些光学字符识别(OCR)技术操作如下首先，通过向灰度级图像应用局部阈值来形成二值图像。接着从二值图像中提取相关的分部(component)，以获得可能的字符区块(segment)。然后利用字符识别技术来检查每个可能的字符区块。不幸的是，当把这些光学字符识别方法应用于具有复杂背景的数字图像如视频图像时，它们将引起两个严重问题。实际上，由于数字图像中存在各种噪声，所以将发现每个字符区块会被错误地分成多个相关的分部。而且，这些方法在计算开销方面成本非常大，因为它们对每个候选字符区块都将应用OCR技术。为了限制要经受字符验证的区块数，Zhong，Y.，Kary，K.，Jain，A.K.的论文(题目“Locating text in complex color images”，发表于“Pattern recognition”，Vol.28，No.10，1995，pp.1523-1535)，提出了两种自动检测彩色图像中的文本区域的特殊方法。第一种方法使用相关分部的分块。因为它预先假定字符是与图像中的其它对象分离的相关分部，所以对于视频图像很难使用。第二种方法基于空间变化的原理...

【技术保护点】
一种在数字图像中自动定位文本区域的方法，包括：第一步骤（１０，２０），用于把数字图像转换为二值图像；第二步骤（３０），用于定位可能文本区域；以及第三步骤（４０），用于选择实际文本区域，其特征在于，用于把数字图像转换为二值图像的第一步骤（１０，２０）包括用于把数字图像转换为灰度级图像的步骤（１０）、以及多分辨率化步骤（２１），多分辨率化步骤（２１）使用插值法来把输入图像Ｉ转换为其大小为输入图像Ｉ的Ｍ倍的更低分辨率的输出图像Ｊ，其中０＜Ｍ＜１，并且用于定位可能文本区域的第二步骤（３０）包括：对二值图像应用形态学操作以便在可能包含文本的原始图像中生成封闭块。

【技术特征摘要】
...

【专利技术属性】
技术研发人员：瓦利德迈赫迪，穆赫辛阿德比利安，陈立明，
申请(专利权)人：里昂中央理工学院，
类型：发明
国别省市：FR[法国]

全部详细技术资料下载我是这个专利的主人