复杂背景图像的处理方法及其装置制造方法及图纸

技术编号：15082447 阅读：101 留言：0更新日期：2017-04-07 13:32

本发明专利技术涉及图像处理技术领域，公开了一种复杂背景图像的处理方法及装置，通过获取相关图像；对相关图像进行灰度化处理和边缘检测；对相关图像进行平滑处理，去除先验信息小于预设阈值的边缘信息，以生成二值图像；利用Sobel算子对二值图像进行处理，生成笔画特征图像；对笔画特征图像进行开运算，并定位所述至少两张笔画特征图像的文字区域；对文字区域进行检测和过滤，以更新所述文字区域在图像中的位置；结合文字区域在多张笔画特征图像中的位置，获得所述文字区域的较精确位置；根据文字区域的较精确位置，分割笔画特征图像中的文字区域和非文字区域，对文字区域进行文字信息的提取和识别。提高了图像中文字区域的定位精度和效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像处理
，尤其涉及一种复杂背景图像的处理方法及装置。
技术介绍
随着资讯的发展，图文资料广泛传播，基于图像的文字识别得到了广泛应用。基于图像的文字区域定位以及文字识别是图像处理技术的重要组成部分，随着经济社会的发展，便携式拍照设备的普及，获得图像的手段越来越多，在获取的这些图像中可能会含有一些如车牌号码，商铺名称，道路名称等文字信息，通过对于这些图像中的文字信息进行识别，在自动驾驶，地理信息数据采集，以及交通检测等应用中都有着重要的意义。同时由于图像的来源广泛，图像的背景呈现出多样性，导致OCR处理容易出现大量乱码，使得OCR识别率大大下降，因此，需要对于复杂背景图像的文字区域进行精确定位和识别。现有技术的文字区域定位和文字识别方法中，通常图像背景较为单调，只需有效消除图像扫描中可能产生的噪声，即可实现文字区域的定位和识别。而在复杂背景图像中，文字信息通常会叠加在背景物体的表面，而背景物体的纹理，色彩错综复杂，文字叠加于复杂的纹理、色彩之上，无法按照现有技术中消除噪声处理，以实现文本区域的定位以及二值化，从而无法进行较为精确的图像文字识别，现有技术的识别方法在复杂背景图像的文字识别中存在着计算效率不高、识别精度低的问题。
技术实现思路
本专利技术提供一种复杂背景图像的处理方法及其装置，解决现有技术中相机标定方式复杂、对标定的系统及环境有特定的要求的技术问题。本专利技术的目的是通过以下技术方案实现的：一种复杂背景图像的处理方法，包括：获取至少两张相关图像，所述至少两张相关图像包含有相同的信息；对所述至少两张相关图像进行灰度化处理和边缘检测...
复杂背景图像的处理方法及其装置

【技术保护点】
一种复杂背景图像的处理方法，其特征在于，包括：获取至少两张相关图像，所述至少两张相关图像包含有相同的信息；对所述至少两张相关图像进行灰度化处理和边缘检测；对所述至少两张相关图像进行平滑处理，去除先验信息小于预设阈值的边缘信息，以生成至少两张二值图像；利用Sobel算子对所述至少两张二值图像进行处理，以生成至少两张笔画特征图像；对所述至少两张笔画特征图像进行开运算，以增强笔画部分的像素密度，并定位所述至少两张笔画特征图像的文字区域；利用滑动窗口对所述至少两张笔画特征图像的文字区域进行检测，根据预设的规则对文字区域进行过滤，更新所述文字区域在所述至少两张笔画特征图像中的位置；结合所述文字区域在所述至少两张笔画特征图像中的位置，通过统计理论获得所述文字区域的较精确位置；根据所述文字区域的较精确位置，分割所述至少两张笔画特征图像中的文字区域和非文字区域，对所述至少两张笔画特征图像中的文字区域进行文字信息的提取和识别。

【技术特征摘要】
1.一种复杂背景图像的处理方法，其特征在于，包括：获取至少两张相关图像，所述至少两张相关图像包含有相同的信息；对所述至少两张相关图像进行灰度化处理和边缘检测；对所述至少两张相关图像进行平滑处理，去除先验信息小于预设阈值的边缘信息，以生成至少两张二值图像；利用Sobel算子对所述至少两张二值图像进行处理，以生成至少两张笔画特征图像；对所述至少两张笔画特征图像进行开运算，以增强笔画部分的像素密度，并定位所述至少两张笔画特征图像的文字区域；利用滑动窗口对所述至少两张笔画特征图像的文字区域进行检测，根据预设的规则对文字区域进行过滤，更新所述文字区域在所述至少两张笔画特征图像中的位置；结合所述文字区域在所述至少两张笔画特征图像中的位置，通过统计理论获得所述文字区域的较精确位置；根据所述文字区域的较精确位置，分割所述至少两张笔画特征图像中的文字区域和非文字区域，对所述至少两张笔画特征图像中的文字区域进行文字信息的提取和识别。2.根据权利要求1所述的方法，其特征在于，所述对所述至少两张笔画特征图像中的文字区域进行文字信息的提取和识别，包括：结合所述至少两张笔画特征图像中的文字信息，并根据图像置信因子，对文字信息进行补全和综合，以获得较精确的文字信息，所述图像置信因子由图像的清晰度获得。3.根据权利要求1所述的方法，其特征在于，所述对所述至少两张相关图像进行平滑处理，去除先验信息小于预设阈值的边缘信息，以生成至少两张二值图像，包括：利用P(i,j)＝G(i,j；σ)*I(i,j)对所述至少两张相关图像I进行高斯平滑，其中，G(i,j；σ)为高斯卷积核，P(i,j)为高斯平滑后的图像P；对高斯平滑后的图像P求偏导，并利用有限差分计算梯度的幅值和方向，对梯度幅值进行非极大值抑制，以获得结果图像Q；建立训练集Ψ，对于训练集Ψ中的图像进行统计，获得先验信息，并结合应用要求，获得阈值，去除结果图像Q中所述先验信息小于阈值的边缘信息，以生成至少两张二值图像。4.根据权利要求1所述的方法，其特征在于，所述利用Sobel算子对所述至少两张二值图像进行处理，以生成至少两张笔画特征图像，包括：利用Sobel算子对所述至少两张二值图像进行处理，分别计算所述至少两张二值图像在水平方向，竖直方向的梯度，以生成笔画特征图像T。5.根据权利要求1所述的方法，其特征在于，所述利用滑动窗口对所述至少两张笔画特征图像的文字区域进行检测，根据预设的规则对文字区域进行过滤，更新所述文字区域在所述至少两张笔画特征图像中的位置，包括：利用滑动窗口对所述至少两张笔画特征图像T进行扫描，并计算所述滑动窗口内的像素密度值ρ和笔画特征强度η，其中，I*J为滑动窗口大小，W为所述滑动窗口内的图像；根据实际应用需要，设定像素密度阈值和笔画特征强度阈值，将超过像素密度阈值和笔画特征强度阈值的区域标记为文字区域M，记录所述文字区域M的位置信息，并将所述文字区域M内的像素值置为1，得到图像T1；通过滑动窗口，对所述图像T1进行扫描，从而得到包含所述位置信息的图像T2，通过对所述图像T2中的像素区域进行定位，更新所述文字区域M在所述至少两张笔画特征图像T中的位置。6.一种复杂背景图像的处理装置，其特征在于，包括：获取模块，用于获取至少两张相关图像，所述至少两张相关图像包含有相同的信息；第一处理模块...

【专利技术属性】
技术研发人员：范荣双，曹萌，郑君，贺鹏艳，荆凯旋，杨宗富，
申请(专利权)人：中测高科北京测绘工程技术有限责任公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人