一种基于判别字典学习与稀疏表示的场景图片文字检测的方法技术

技术编号：14116004 阅读：109 留言：0更新日期：2016-12-07 18:25

本发明专利技术涉及一种基于判别字典学习与稀疏表示的场景图片文字检测的方法，属于数字图像处理技术领域。首先用训练数据以及提出的判别字典学习的方法训练学习出两个字典：文字字典和背景字典，再序列地合并文字字典和背景字典；然后由合并的字典、待检测的图像以及稀疏表示的方法计算出待检测图像所对应的文字和背景的稀疏表示系数；最后由学习到的字典与计算出的待检测图像对应的稀疏表示系数，重建待检测图像中的文字；用启发式规则对重建的文字图像中的文字区域进行处理从而检测出待检测图像中的候选的文字区域；本发明专利技术提出的判别字典学习与稀疏表示的场景图像文字检测的方法可以大幅度提高文字识别的准确度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种基于判别字典学习与稀疏表示的场景图片文字检测的方法，属于数字图像处理

技术介绍
进入21世纪以来，互联网行业飞速发展，加之近几年智能手机的蓬勃发展，在PC端与移动终端的数字信息正在飞快的增长。数字图像和视频正是当今数字世界的主要元素之一，数字图像和视频中往往包含大量的文本区域，而这些文本信息正是理解该图像和视频含义的重要线索。如何从复杂的自然场景图像中提取出文本信息，对图像理解、图像检索都将有着非同寻常的意义，因此场景图像中的文本定位技术的研究吸引了众多海内外学者的研究。场景图像的文本定位算法是指，通过信息处理技术自动标记出图像中的文本区域，为后续的文字识别奠定基础。场景图像中的非文本区域可能是任何随机的场景，文本区域可能是嵌入在背景中的，也有可能成为背景纹理的一部分，甚至文本被背景部分遮挡等等，这些问题是文本定位的主要难题，也是场景图像文定位算法面临的核心问题。国内外的研究者们提出了不同的算法来解决这些问题并在该领域取得了丰富的研究成果，使得文本定位在许多领域中得到了广泛的应用，例如在图像检索/分类、不良信息的过滤、车牌识别等技术方面的应用。总结目前研究人员的工作，图像和视频文字检测方法主要分为基于边缘特征的方法、基于连通区域的方法、基于纹理特征的方法、基于机器学习的方法和一些综合上述几种的混合方法。基于边缘特征的方法主要是利用文本丰富的边缘信息进行文本区域的检测，该类方法通常先使用一些边缘检测算子，如梯度算子、Sobel算子、Canny算子等。基于边缘特征的方法优点很明显：速度很快。但是其缺点也很明显：当背景含有丰富的强边...
一种基于判别字典学习与稀疏表示的场景图片文字检测的方法

【技术保护点】
一种基于判别字典学习与稀疏表示的场景图像文字检测的方法，其特征在于：首先用训练数据以及提出的判别字典学习的方法训练学习出两个字典：文字字典和背景字典，再序列地合并文字字典和背景字典；然后由合并的字典、待检测的图像以及稀疏表示的方法计算出待检测图像所对应的文字和背景的稀疏表示系数；最后由学习到的字典与计算出的待检测图像对应的稀疏表示系数，重建待检测图像中的文字；用启发式规则对重建的文字图像中的文字区域进行处理从而检测出待检测图像中的候选的文字区域；具体步骤为：Step1、首先构建文字和背景的训练样本；Step1.1、从互联网上收集文字图像和背景图像，其中文字图像只含有文字没有背景纹理，背景图像不含有文字；Step1.2、以滑动窗口的形式采集Step1.1中的文字图像和背景图像的数据，每个窗口(n×n)采集到数据作为一个列向量(n2×1)，n为滑动窗口的大小，所有采集到的文字训练数据和背景训练数据为两个n2维的矩阵；Step2、利用训练样本学习字典；Step2.1、提出字典学习的目标函数：minD,X{||Y-DX||F2+λ1||X||1+λ2f(DX)}s....

【技术特征摘要】
1.一种基于判别字典学习与稀疏表示的场景图像文字检测的方法，其特征在于：首先用训练数据以及提出的判别字典学习的方法训练学习出两个字典：文字字典和背景字典，再序列地合并文字字典和背景字典；然后由合并的字典、待检测的图像以及稀疏表示的方法计算出待检测图像所对应的文字和背景的稀疏表示系数；最后由学习到的字典与计算出的待检测图像对应的稀疏表示系数，重建待检测图像中的文字；用启发式规则对重建的文字图像中的文字区域进行处理从而检测出待检测图像中的候选的文字区域；具体步骤为：Step1、首先构建文字和背景的训练样本；Step1.1、从互联网上收集文字图像和背景图像，其中文字图像只含有文字没有背景纹理，背景图像不含有文字；Step1.2、以滑动窗口的形式采集Step1.1中的文字图像和背景图像的数据，每个窗口(n×n)采集到数据作为一个列向量(n2×1)，n为滑动窗口的大小，所有采集到的文字训练数据和背景训练数据为两个n2维的矩阵；Step2、利用训练样本学习字典；Step2.1、提出字典学习的目标函数： m i n ...

【专利技术属性】
技术研发人员：李华锋，刘舒萍，汤宏颖，余正涛，
申请(专利权)人：昆明理工大学，
类型：发明
国别省市：云南;53

全部详细技术资料下载我是这个专利的主人