一种基于颜色差异的行驶证信息提取方法技术

技术编号:23191488 阅读:20 留言:0更新日期:2020-01-24 16:28
本发明专利技术属于图像处理技术领域,公开了一种基于颜色差异的行驶证信息提取方法,包括以下步骤:S1、对RGB格式的输入图像的G通道和B通道求差值得到差值图像;S2、对差值图像进行形态学膨胀操作,以填充图像的空洞和噪声点;S3、利用大津法确定阈值,然后对步骤S2得到的图像进行二值化操作,得到字符区域的二值图像;S4、寻找字符区域中的连通区域,统计每个连通区域的面积,然后去掉部分面积较小的区域;S5、进行文字提取,得到行驶证信息。本发明专利技术运行速度快,定位精度高,可以广泛应用于交通领域。

【技术实现步骤摘要】
一种基于颜色差异的行驶证信息提取方法
本专利技术属于图像处理
,具体涉及一种基于颜色差异的行驶证信息提取方法。
技术介绍
近年来随着信息自动化的发展,自动提取与识别信息的技术得到了越来越多的关注,自动识别行驶证中的文字是一个实际应用的例子。图片作为重要的信息载体,图像中的文本信息是理解整个图像的重要内容。图像内容可分为两个方面:感知内容和语义内容。感知内容包括颜色、强度、形状、纹理和它们的时空变化等诸多属性;语义内容是指物体、事物和它们的关系。针对一系列的图像中低水平感知内容的研究运用见报道,图像中的语义内容(如文本、人脸、车辆、手势等)也引起广泛的关注。其中文本信息吸引了特别的兴趣,这是因为:1)文本对于标书图像内容非常有用;2)文本相对于其他的语义内容更加容易提取;3)文本提取在基于关键词的图像索引、自动记录和安全监控等方面有重要应用;4)光学字符识别软件更加成熟。目前图像文本识别的方法可以总结为以下四种:1)基于边缘的文字检测方法。对于只有一行文字并且文字排列的方向是水平或者垂直的图像,通过向水平或者垂直方向做投影,而后利用文字间的空隙和文字的投影,将文字分割和区分开来。这种方法简单快捷,但是只能适用于简单的场合。2)基于纹理的文字检测方法。利用判断纹理特征判断一个像素点或者像素区域是否属于文字。这种方法对于复杂背景中的文字能给个较好的检测出来,但是这种算法存在着定位不准和算法复杂度较高的缺点。3)基于区域的文字检测方法。此方法试讲字符作为满足特定启发规则的单色区域来检测。这种方法的处理速度快并且定位精确,但是只适用于二值图像,具有局限性。4)基于学习的文字检测方法。此方法引入学习机制,先通过选取的样本来学习进行检测的网络,然后利用训练好的网络预测来检测文字。此方法一方面需要大量的样本来训练网络;另一方面训练样本和测试样本的相似程度影响着最后的识别效果。综上所述,目前的算法只是利用了图像的部分信息,未能充分利用图像具有的信息。我们的行驶证是绿色的背景上用黑色文字书写对应的内容。利用这个背景和文字的差异性,能够有效的提取行驶证的文本内容。
技术实现思路
为适应交通领域的实际需求,本专利技术克服现有技术存在的不足,所要解决的技术问题为提供一种基于颜色差异的行驶证信息提取方法,以实现行驶证图像上的文本信息的自动提取,以及每个字符定位。为了解决上述技术问题,本专利技术采用的技术方案为:一种基于颜色差异的行驶证信息提取方法,包括以下步骤:S1、对RGB格式的输入图像的G通道和B通道求差值得到差值图像,其中,G通道表示绿色通道,B通道表示蓝色通道,输入图像的大小为H×W,H为图像的高度,W表示图像的宽度,mask(i,j)表示差值图像;S2、对差值图像进行形态学膨胀操作,以填充图像的空洞和噪声点;S3、利用大津法确定阈值,然后对步骤S2得到的图像进行二值化操作,得到字符区域的二值图像;S4、寻找字符区域中的连通区域,统计每个连通区域的面积,然后去掉部分面积较小的区域,从而消除噪声区域的影响;S5、通过垂直投影法,对步骤S5得到的区域进行文字提取,得到行驶证信息。所述步骤S1中,对RGB格式的输入图像的G和B通道求差值得到差值图像的计算公式为:mask(i,j)=|G(i,j)-B(i,j)|,1≤i≤H,1≤j≤W;其中,(i,j)表示图像的像素点坐标,G(i,j)表示图像上坐标为(i,j)的像素点的绿色通道值,B(i,j)图像上坐标为(i,j)的像素点的蓝色通道值。所述步骤S2中,对差值图像进行形态学膨胀操作的计算公式为:mask′(i,j)=Dilation(mask(i,j)),1≤i≤H,1≤j≤W;其中,mask(i,j)表示差值图像;Dilation表示膨胀函数,mask′(i,j)表示形态学膨胀操作后的图像。所述步骤S3中,二值化操作的计算公式为:其中,mask″(i,j)表示二值图像,K表示阈值,mask′(i,j)表示形态学膨胀操作后的图像。所述步骤S4中,去掉部分面积较小的区域的具体方法为:找到各个连通区域中面积最大的区域,根据面积最大的区域设定阈值,然后去除面积小于阈值的连通区域。所述步骤S4中,所述阈值为面积最大的区域的面积的10%。本专利技术与现有技术相比具有以下有益效果:本专利技术通过对RGB格式的图像G和B通道求差值,接着利用形态学膨胀填充空洞和噪声点,然后利用阈值求取二值图,从而得到每个字符所在区域,最后去取小面积区域从而去除噪声区域。通过以上方法进行行驶证信息的提取,使得本专利技术的运行速度快,能实时进行字符分割;并且本专利技术的字符区域定位精度高,误认为字符区域的错误率很低。附图说明图1为本专利技术实施例提供的一种基于颜色差异的行驶证信息提取方法的步骤示意图。具体实施方式为使本专利技术的技术方案和优点更加清楚,下面将结合具体实施例和附图,对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术的一部分实施例,而不是全部的实施例;基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供了一种基于颜色差异的行驶证信息提取方法,包括以下步骤:S1、对RGB格式的输入图像的G通道和B通道求差值得到差值图像,其中,G通道表示绿色通道,B通道表示蓝色通道,输入图像的大小为H×W,H为图像的高度,W表示图像的宽度,mask(i,j)表示差值图像。所述步骤S1中,对RGB格式的输入图像的G和B通道求差值得到差值图像的计算公式为:mask(i,j)=|G(i,j)-B(i,j)|,1≤i≤H,1≤j≤W;(1)其中,(i,j)表示图像的像素点坐标,G(i,j)表示图像上坐标为(i,j)的像素点的绿色通道值,B(i,j)图像上坐标为(i,j)的像素点的蓝色通道值。S2、对差值图像进行形态学膨胀操作,以填充图像的空洞和噪声点。所述步骤S2中,对差值图像进行形态学膨胀操作的计算公式为:mask′(i,j)=Dilation(mask(i,j)),1≤i≤H,1≤j≤W;(2)其中,mask(i,j)表示差值图像;Dilation表示膨胀函数,mask′(i,j)表示形态学膨胀操作后的图像。S3、利用大津法确定阈值,然后对步骤S2得到的图像进行二值化操作,得到字符区域的二值图像。所述步骤S3中,大津法为图像处理领域的常规方法,因此在此不做赘述,此外,二值化操作的计算公式为:其中,mask″(i,j)表示二值图像,K表示阈值,mask′(i,j)表示形态学膨胀操作后的图像。S4、寻找字符区域中的连通区域,统计每个连通区域的面积,然后找到面积最大的区域,并且去掉面积小于最大区域的10%的区域,从而消除噪声区域的影响。其中,去掉面本文档来自技高网
...

【技术保护点】
1.一种基于颜色差异的行驶证信息提取方法,其特征在于,包括以下步骤:/nS1、对RGB格式的输入图像的G通道和B通道求差值得到差值图像,其中,G通道表示绿色通道,B通道表示蓝色通道,输入图像的大小为H×W,H为图像的高度,W表示图像的宽度;/nS2、对差值图像进行形态学膨胀操作,以填充图像的空洞和噪声点;/nS3、利用大津法确定阈值,然后对步骤S2得到的图像进行二值化操作,得到字符区域的二值图像;/nS4、寻找字符区域中的连通区域,统计每个连通区域的面积,然后去掉部分面积较小的区域,从而消除噪声区域的影响;/nS5、通过垂直投影法,对步骤S5得到的区域进行文字提取,得到行驶证信息。/n

【技术特征摘要】
1.一种基于颜色差异的行驶证信息提取方法,其特征在于,包括以下步骤:
S1、对RGB格式的输入图像的G通道和B通道求差值得到差值图像,其中,G通道表示绿色通道,B通道表示蓝色通道,输入图像的大小为H×W,H为图像的高度,W表示图像的宽度;
S2、对差值图像进行形态学膨胀操作,以填充图像的空洞和噪声点;
S3、利用大津法确定阈值,然后对步骤S2得到的图像进行二值化操作,得到字符区域的二值图像;
S4、寻找字符区域中的连通区域,统计每个连通区域的面积,然后去掉部分面积较小的区域,从而消除噪声区域的影响;
S5、通过垂直投影法,对步骤S5得到的区域进行文字提取,得到行驶证信息。


2.根据权利要求1所述的一种基于颜色差异的行驶证信息提取方法,其特征在于,所述步骤S1中,对RGB格式的输入图像的G和B通道求差值得到差值图像的计算公式为:
mask(i,j)=|G(i,j)-B(i,j)|,1≤i≤H,1≤j≤W;
其中,(i,j)表示图像的像素点坐标,G(i,j)表示图像上坐标为(i,j)的像素点的绿色通道值,B(i,j)图像上坐标为(i,j)的像素点的蓝色通道值,mask(i,j)表示差...

【专利技术属性】
技术研发人员:慕乾勇韩永昌
申请(专利权)人:青岛康特网络科技有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1