复杂背景图像的处理方法及其装置制造方法及图纸

技术编号:15082447 阅读:101 留言:0更新日期:2017-04-07 13:32
本发明专利技术涉及图像处理技术领域,公开了一种复杂背景图像的处理方法及装置,通过获取相关图像;对相关图像进行灰度化处理和边缘检测;对相关图像进行平滑处理,去除先验信息小于预设阈值的边缘信息,以生成二值图像;利用Sobel算子对二值图像进行处理,生成笔画特征图像;对笔画特征图像进行开运算,并定位所述至少两张笔画特征图像的文字区域;对文字区域进行检测和过滤,以更新所述文字区域在图像中的位置;结合文字区域在多张笔画特征图像中的位置,获得所述文字区域的较精确位置;根据文字区域的较精确位置,分割笔画特征图像中的文字区域和非文字区域,对文字区域进行文字信息的提取和识别。提高了图像中文字区域的定位精度和效率。

【技术实现步骤摘要】

本专利技术涉及图像处理
,尤其涉及一种复杂背景图像的处理方法及装置。
技术介绍
随着资讯的发展,图文资料广泛传播,基于图像的文字识别得到了广泛应用。基于图像的文字区域定位以及文字识别是图像处理技术的重要组成部分,随着经济社会的发展,便携式拍照设备的普及,获得图像的手段越来越多,在获取的这些图像中可能会含有一些如车牌号码,商铺名称,道路名称等文字信息,通过对于这些图像中的文字信息进行识别,在自动驾驶,地理信息数据采集,以及交通检测等应用中都有着重要的意义。同时由于图像的来源广泛,图像的背景呈现出多样性,导致OCR处理容易出现大量乱码,使得OCR识别率大大下降,因此,需要对于复杂背景图像的文字区域进行精确定位和识别。现有技术的文字区域定位和文字识别方法中,通常图像背景较为单调,只需有效消除图像扫描中可能产生的噪声,即可实现文字区域的定位和识别。而在复杂背景图像中,文字信息通常会叠加在背景物体的表面,而背景物体的纹理,色彩错综复杂,文字叠加于复杂的纹理、色彩之上,无法按照现有技术中消除噪声处理,以实现文本区域的定位以及二值化,从而无法进行较为精确的图像文字识别,现有技术的识别方法在复杂背景图像的文字识别中存在着计算效率不高、识别精度低的问题。
技术实现思路
本专利技术提供一种复杂背景图像的处理方法及其装置,解决现有技术中相机标定方式复杂、对标定的系统及环境有特定的要求的技术问题。本专利技术的目的是通过以下技术方案实现的:一种复杂背景图像的处理方法,包括:获取至少两张相关图像,所述至少两张相关图像包含有相同的信息;对所述至少两张相关图像进行灰度化处理和边缘检测;对所述至少两张相关图像进行平滑处理,去除先验信息小于预设阈值的边缘信息,以生成至少两张二值图像;利用Sobel算子对所述至少两张二值图像进行处理,以生成至少两张笔画特征图像;对所述至少两张笔画特征图像进行开运算,以增强笔画部分的像素密度,并定位所述至少两张笔画特征图像的文字区域;利用滑动窗口对所述至少两张笔画特征图像的文字区域进行检测,根据预设的规则对文字区域进行过滤,更新所述文字区域在所述至少两张笔画特征图像中的位置;结合所述文字区域在所述至少两张笔画特征图像中的位置,通过统计理论获得所述文字区域的较精确位置;根据所述文字区域的较精确位置,分割所述至少两张笔画特征图像中的文字区域和非文字区域,对所述至少两张笔画特征图像中的文字区域进行文字信息的提取和识别。一种复杂背景图像的处理装置,包括:获取模块,用于获取至少两张相关图像,所述至少两张相关图像包含有相同的信息;第一处理模块,用于对所述至少两张相关图像进行灰度化处理和边缘检测;第二处理模块,用于对所述至少两张相关图像进行平滑处理,去除先验信息小于预设阈值的边缘信息,以生成至少两张二值图像;第三处理模块,用于利用Sobel算子对所述至少两张二值图像进行处理,以生成至少两张笔画特征图像;第一定位模块,用于对所述至少两张笔画特征图像进行开运算,以增强笔画部分的像素密度,并定位所述至少两张笔画特征图像的文字区域;第二定位模块,用于利用滑动窗口对所述至少两张笔画特征图像的文字区域进行检测,根据预设的规则对文字区域进行过滤,更新所述文字区域在所述至少两张笔画特征图像中的位置;第三定位模块,用于结合所述文字区域在所述至少两张笔画特征图像中的位置,通过统计理论获得所述文字区域的较精确位置;识别模块,用于根据所述文字区域的较精确位置,分割所述至少两张笔画特征图像中的文字区域和非文字区域,对所述至少两张笔画特征图像中的文字区域进行文字信息的提取和识别。通过本专利技术提供的一种复杂背景图像的处理方法及装置,通过获取相关图像;对相关图像进行灰度化处理和边缘检测;对相关图像进行平滑处理,去除先验信息小于预设阈值的边缘信息,以生成二值图像;利用Sobel算子对二值图像进行处理,生成笔画特征图像;对笔画特征图像进行开运算,并定位所述至少两张笔画特征图像的文字区域;对文字区域进行检测和过滤,以更新所述文字区域在图像中的位置;结合文字区域在多张笔画特征图像中的位置,获得所述文字区域的较精确位置;根据文字区域的较精确位置,分割笔画特征图像中的文字区域和非文字区域,对文字区域进行文字信息的提取和识别。提高了图像中文字区域的定位精度和效率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种复杂背景图像的处理方法的流程图;图2为本专利技术实施例提供的一种复杂背景图像的处理方法的示例图;图3为本专利技术实施例提供的一种复杂背景图像的处理装置的结构示意图。具体实施方式为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。本专利技术实施例中提供了一种复杂背景图像的处理方法,如图1所示,为本专利技术实施例中提供的一种复杂背景图像的处理方法的流程图,包括:步骤101、获取相关图像;其中,所述至少两张相关图像包含有相同的信息;例如:同一杂志,不同像素精度的相机在相同位置获得的多张图像,不同相机拍摄的多张图像在分辨率,色彩上有着一定的差异,或者由于拍摄问题造成有的图像的文字遮挡、曝光过度、以及拍摄时间不同导致有的图像污损。步骤102、对相关图像进行灰度化处理和边缘检测;其中,对步骤101获取的多张相关图像先进行灰度化处理之后,利用边缘Canny算子进行Canny边缘检测;步骤103、对相关图像进行平滑处理,去除先验信息小于预设阈值的边缘信息,以生成二值图像;其中,所述步骤103具体包括:步骤103-1、利用P(i,j)=G(i,j;σ)*I(i,j)对所述至少两张相关图像I进行高斯平滑,其中,G(i,j;σ)为高斯卷积核,P(i,j)为高斯平滑后的图像P;步骤103-2、对高斯平滑后的图像P求偏导,并利用有限差分计算梯度的幅值和方向,对梯度幅值进行非极大值抑制,以获得结果图像Q;步骤103-3、建立训练集Ψ,对于训练集Ψ中的图像进行统计,获得先验信息,并结合应用要求,获得阈值,去除结果图像Q中所述先验信息小于阈值的边缘信息,以生成至少两张二值图像。步骤104、利用Sobel算子对二值图像进行处理,生成笔画特征图像;其中,对于步骤103生成的每幅图像Q,使用Sobel算子进行处理,分别求其在水平方向和竖直方向的梯度,对于结果进行结合,从而生成笔画特征图像T;步骤105、对笔画特征图像进行开运算,并定位所述至少两张笔画特征图像的文字区域;其中,对笔画特征图像进行开运算,可以增强笔画部分的像素密度。步骤106、对文字区域进行检测和过滤,以更新所述文字区域在图像中的位置;其中,步骤106具体可以包括:步骤106-1、利用滑动窗口对所述至少两张笔画特征图像T进行扫描,并计算所述滑动窗口内的像素密度值ρ和笔画特征强度η,其中,I*J为滑动窗口大小,W为所述滑动窗口内的图像;步骤106-2、根据实际应用需要,设定像素密度阈值和笔画特征强度阈值,将超过像素密度阈值和笔画特征强度阈值的区域标记为文字区域M,记录所述文本文档来自技高网...
复杂背景图像的处理方法及其装置

【技术保护点】
一种复杂背景图像的处理方法,其特征在于,包括:获取至少两张相关图像,所述至少两张相关图像包含有相同的信息;对所述至少两张相关图像进行灰度化处理和边缘检测;对所述至少两张相关图像进行平滑处理,去除先验信息小于预设阈值的边缘信息,以生成至少两张二值图像;利用Sobel算子对所述至少两张二值图像进行处理,以生成至少两张笔画特征图像;对所述至少两张笔画特征图像进行开运算,以增强笔画部分的像素密度,并定位所述至少两张笔画特征图像的文字区域;利用滑动窗口对所述至少两张笔画特征图像的文字区域进行检测,根据预设的规则对文字区域进行过滤,更新所述文字区域在所述至少两张笔画特征图像中的位置;结合所述文字区域在所述至少两张笔画特征图像中的位置,通过统计理论获得所述文字区域的较精确位置;根据所述文字区域的较精确位置,分割所述至少两张笔画特征图像中的文字区域和非文字区域,对所述至少两张笔画特征图像中的文字区域进行文字信息的提取和识别。

【技术特征摘要】
1.一种复杂背景图像的处理方法,其特征在于,包括:获取至少两张相关图像,所述至少两张相关图像包含有相同的信息;对所述至少两张相关图像进行灰度化处理和边缘检测;对所述至少两张相关图像进行平滑处理,去除先验信息小于预设阈值的边缘信息,以生成至少两张二值图像;利用Sobel算子对所述至少两张二值图像进行处理,以生成至少两张笔画特征图像;对所述至少两张笔画特征图像进行开运算,以增强笔画部分的像素密度,并定位所述至少两张笔画特征图像的文字区域;利用滑动窗口对所述至少两张笔画特征图像的文字区域进行检测,根据预设的规则对文字区域进行过滤,更新所述文字区域在所述至少两张笔画特征图像中的位置;结合所述文字区域在所述至少两张笔画特征图像中的位置,通过统计理论获得所述文字区域的较精确位置;根据所述文字区域的较精确位置,分割所述至少两张笔画特征图像中的文字区域和非文字区域,对所述至少两张笔画特征图像中的文字区域进行文字信息的提取和识别。2.根据权利要求1所述的方法,其特征在于,所述对所述至少两张笔画特征图像中的文字区域进行文字信息的提取和识别,包括:结合所述至少两张笔画特征图像中的文字信息,并根据图像置信因子,对文字信息进行补全和综合,以获得较精确的文字信息,所述图像置信因子由图像的清晰度获得。3.根据权利要求1所述的方法,其特征在于,所述对所述至少两张相关图像进行平滑处理,去除先验信息小于预设阈值的边缘信息,以生成至少两张二值图像,包括:利用P(i,j)=G(i,j;σ)*I(i,j)对所述至少两张相关图像I进行高斯平滑,其中,G(i,j;σ)为高斯卷积核,P(i,j)为高斯平滑后的图像P;对高斯平滑后的图像P求偏导,并利用有限差分计算梯度的幅值和方向,对梯度幅值进行非极大值抑制,以获得结果图像Q;建立训练集Ψ,对于训练集Ψ中的图像进行统计,获得先验信息,并结合应用要求,获得阈值,去除结果图像Q中所述先验信息小于阈值的边缘信息,以生成至少两张二值图像。4.根据权利要求1所述的方法,其特征在于,所述利用Sobel算子对所述至少两张二值图像进行处理,以生成至少两张笔画特征图像,包括:利用Sobel算子对所述至少两张二值图像进行处理,分别计算所述至少两张二值图像在水平方向,竖直方向的梯度,以生成笔画特征图像T。5.根据权利要求1所述的方法,其特征在于,所述利用滑动窗口对所述至少两张笔画特征图像的文字区域进行检测,根据预设的规则对文字区域进行过滤,更新所述文字区域在所述至少两张笔画特征图像中的位置,包括:利用滑动窗口对所述至少两张笔画特征图像T进行扫描,并计算所述滑动窗口内的像素密度值ρ和笔画特征强度η,其中,I*J为滑动窗口大小,W为所述滑动窗口内的图像;根据实际应用需要,设定像素密度阈值和笔画特征强度阈值,将超过像素密度阈值和笔画特征强度阈值的区域标记为文字区域M,记录所述文字区域M的位置信息,并将所述文字区域M内的像素值置为1,得到图像T1;通过滑动窗口,对所述图像T1进行扫描,从而得到包含所述位置信息的图像T2,通过对所述图像T2中的像素区域进行定位,更新所述文字区域M在所述至少两张笔画特征图像T中的位置。6.一种复杂背景图像的处理装置,其特征在于,包括:获取模块,用于获取至少两张相关图像,所述至少两张相关图像包含有相同的信息;第一处理模块...

【专利技术属性】
技术研发人员:范荣双曹萌郑君贺鹏艳荆凯旋杨宗富
申请(专利权)人:中测高科北京测绘工程技术有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1