一种检测图像中文本信息的方法技术

技术编号：23705748 阅读：37 留言：0更新日期：2020-04-08 11:20

本发明专利技术公开了一种检测图像中文本信息的方法，通过对自然文本图像数据库中下载的多张带有文本信息的自然街景图像进行一系列的处理，从而构建出字体语素数据库，使字体语素数据库中包含有通用的汉文字符；然后通过字体语素数据库直接对待检测的自然街景图像进行文本字符识别并输出，同时又增加人工检视的方式识别生僻字符，进而完善字体语素数据库；具有操作简单、识别精度高、人工干预少，特别解决了自然场景下的弯曲变形字难以检测的问题。

A method of detecting text information in image

全部详细技术资料下载

【技术实现步骤摘要】
一种检测图像中文本信息的方法
本专利技术属于图像处理
，更为具体地讲，涉及一种检测图像中文本信息的方法。
技术介绍
OCR(OpticalCharacterRecognition)是光学字符识别，表示通过光学数字化设备(比如扫描仪、数码相机等)拍摄的图像，对图像中的文字进行识别。在文档图像处理领域还有一个更大的概念：DAR(DocumentAnalysis&Recognition)即文档图像分析和识别，这是一个更广泛的概念。另外一个比较细的领域就是场景文字识别STR(SceneTextRecognition)，主要是针对自然场景当中以手机为主的拍摄图片从中检测和识别文字。综上所述，OCR、DAR及STR有着不同的概念，OCR是最为人熟知的一种概念，场景文字识别实际上是OCR的一种典型分支。近几年DAR技术的发展已经非常好，对于文档图像的分析与识别，国内外的众多大公司推出了很多相关技术产品，很多产品也已经融入到我们的日常生活中。此类产品针对的是文档文本，即相对比较工整正规的、没有形变扭曲字的文本检测及识别...

【技术保护点】
1.一种检测图像中文本信息的方法，其特征在于，包括以下步骤：/n(1)、构建训练数据库/n(1.1)、从自然文本图像数据库中下载多张带有文本信息的自然街景图像；/n(1.2)、通过手动标记的方式标记出自然街景图像中的文本信息区域，标记为感兴趣区域，并标记上标签，最后将标记好标签的图像存储在训练数据库；/n(2)、图像预处理/n(2.1)、从训练数据库中随机选取一张图像，再转换为灰度图，然后将带有标签出的感兴趣区域的像素值保持不变，其余位置的像素值置为0；/n(2.2)、对步骤(2.1)处理后的图像进行分块处理，等分为N×N大小的矩形块，在等分过程中，对于图像中多出的行或列，则在其后补充相应的行...

【技术特征摘要】
1.一种检测图像中文本信息的方法，其特征在于，包括以下步骤：
(1)、构建训练数据库
(1.1)、从自然文本图像数据库中下载多张带有文本信息的自然街景图像；
(1.2)、通过手动标记的方式标记出自然街景图像中的文本信息区域，标记为感兴趣区域，并标记上标签，最后将标记好标签的图像存储在训练数据库；
(2)、图像预处理
(2.1)、从训练数据库中随机选取一张图像，再转换为灰度图，然后将带有标签出的感兴趣区域的像素值保持不变，其余位置的像素值置为0；
(2.2)、对步骤(2.1)处理后的图像进行分块处理，等分为N×N大小的矩形块，在等分过程中，对于图像中多出的行或列，则在其后补充相应的行或列，从而补充出一行或一列N×N大小的矩形块；
(3)、矩形块的DCT处理
利用离散余弦变换DCT算法对图像中的每个矩形块进行处理理，具体处理方法为如下公式：

其中，f(μ,υ)表示坐标为(μ,υ)的矩形块经过DCT处理后的值，P(m,n)表示图像中坐标为(m,n)的像素点的像素值，m,n∈[0,N-1]
(4)、在图像中标记字符出现区域
(4.1)、每个矩形块进行DCT处理完成后，将每个值f(μ,υ)按照矩形框在图像...

【专利技术属性】
技术研发人员：杨波，陈尔奎，张洁勤，郑文锋，刘珊，
申请(专利权)人：山东华尚电气有限公司，电子科技大学，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人