一种基于形态成分分析与自适应字典学习的场景图像文字检测的方法技术

技术编号：14146992 阅读：79 留言：0更新日期：2016-12-11 04:01

本发明专利技术涉及一种基于形态成分分析与自适应字典学习的场景图像文字检测的方法，属于数字图像处理技术领域。首先构建样本数据并训练出两个初始字典：文字字典和背景字典；然后由训练好的初始字典、待检测的图像和自适应字典学习算法计算出待检测图像的文字和背景所对应的字典和稀疏表示系数；再由自适应字典和待检测图像对应的稀疏表示系数重建待检测图像中的文字图像；用启发式规则对重建的文字图像进行处理来检测出待检测图像中的候选的文字区域；最后用矩形框框出最终的文字区域。本发明专利技术使计算机能够自动地理解图像所包含的语义信息、并为导盲技术，车牌识别和车辆定位追踪技术以及图像检索技术等提供了有力的支撑。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种基于形态成分分析与自适应字典学习的场景图像文字检测的方法，属于数字图像处理

技术介绍
进入21世纪以来，互联网行业飞速发展，加之近几年智能手机的蓬勃发展，在PC端与移动终端的数字信息正在飞快的增长。数字图像和视频正是当今数字世界的主要元素之一，数字图像和视频中往往包含大量的文本区域，而这些文本信息正是理解该图像和视频含义的重要线索。如何从复杂的自然场景图像中提取出文本信息，对图像理解、图像检索都将有着非同寻常的意义，因此场景图像中的文本定位技术的研究吸引了众多海内外学者的研究。场景图像的文本定位算法是指，通过信息处理技术自动标记出图像中的文本区域，为后续的文字识别奠定基础。场景图像中的非文本区域可能是任何随机的场景，文本区域可能是嵌入在背景中的，也有可能成为背景纹理的一部分，甚至文本被背景部分遮挡等等，这些问题是文本定位的主要难题，也是场景图像文定位算法面临的核心问题。国内外的研究者们提出了不同的算法来解决这些问题并在该领域取得了丰富的研究成果，使得文本定位在许多领域中得到了广泛的应用，例如在图像检索/分类、不良信息的过滤、车牌识别等技术方面的应用。总结目前研究人员的工作，图像和视频文字检测方法主要分为基于边缘特征的方法、基于连通区域的方法、基于纹理特征的方法、基于机器学习的方法和一些综合上述几种的混合方法。基于边缘特征的方法主要是利用文本丰富的边缘信息进行文本区域的检测，该类方法通常先使用一些边缘检测算子，如梯度算子、Sobel算子、Canny算子等。基于边缘特征的方法优点很明显：速度很快。但是其缺点也很明显：当背景含有丰富...
一种基于形态成分分析与自适应字典学习的场景图像文字检测的方法

【技术保护点】
一种基于形态成分分析与自适应字典学习的场景图像文字检测的方法，其特征在于：首先构建样本数据并训练出两个初始字典：文字字典和背景字典；然后由训练好的初始字典、待检测的图像和自适应字典学习算法计算出待检测图像的文字和背景所对应的字典和稀疏表示系数；再由自适应字典和待检测图像对应的稀疏表示系数重建待检测图像中的文字图像；用启发式规则对重建的文字图像进行处理来检测出待检测图像中的候选的文字区域；最后用矩形框框出最终的文字区域；具体步骤为：Step1、训练样本的采集；Step1.1、从互联网上收集文字图像和背景图像，其中文字图像只有文字没有背景纹理，背景图像不含有文字；Step1.2、用滑动窗口采集Step1.1中的文字图像和背景图像的数据，每个窗口(n×n)的数据作为一个列向量(n2×1)，列向量统一称为原子，n为滑动窗口的大小，这样所有采集到的文字训练数据和背景训练数据为两个n2维的矩阵；Step2、用K‑svd的方法学习初始字典；用K‑svd的方法学习初始字典，学习字典的目标函数为：minD,α{||x-Dα||F2+λ1||α||1}s....

【技术特征摘要】
1.一种基于形态成分分析与自适应字典学习的场景图像文字检测的方法，其特征在于：首先构建样本数据并训练出两个初始字典：文字字典和背景字典；然后由训练好的初始字典、待检测的图像和自适应字典学习算法计算出待检测图像的文字和背景所对应的字典和稀疏表示系数；再由自适应字典和待检测图像对应的稀疏表示系数重建待检测图像中的文字图像；用启发式规则对重建的文字图像进行处理来检测出待检测图像中的候选的文字区域；最后用矩形框框出最终的文字区域；具体步骤为：Step1、训练样本的采集；Step1.1、从互联网上收集文字图像和背景图像，其中文字图像只有文字没有背景纹理，背景图像不含有文字；Step1.2、用滑动窗口采集Step1.1中的文字图像和背景图像的数据，每个窗口(n×n)的数据作为一个列向量(n2×1)，列向量统一称为原子，n为滑动窗口的大小，这样所有采集到的文字训练数据和背景训练数据为两个n2维的矩阵；Step2、用K-svd的方法学习初始字典；用K-svd的方法学习初始字典，学习字典的目标函数为： ...

【专利技术属性】
技术研发人员：李华锋，刘舒萍，汤宏颖，余正涛，
申请(专利权)人：昆明理工大学，
类型：发明
国别省市：云南;53

全部详细技术资料下载我是这个专利的主人