影像的资料与背景分离的方法技术

技术编号:2936847 阅读:219 留言:0更新日期:2012-04-11 18:40
利用照明特性与文件特性,在照明不理想的环境下,以扫描的处理方式,利用动态调整分界值将文件影像中的资料成分与背景成分分离,以获取文件中的资讯。本发明专利技术包括:将影像中的像素(pixel)区分为“稳定态”与“转变态”的方法;对“稳定态”像素调整分界值的方法;对“转变态”像素调整分界值的方法;从水平、垂直两方向共同决定分界值的方法。(*该技术在2012年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术是关于一种影像资料的资料与背景分离方法,特别是关于在照明不理想的环境下,利用静态或动态的分界值,将文件影像中的资料成分与背景成分分离的方法。利用电脑做光学影像处理(例如光学字元辨识OCR)时,必须先将文件中的资料成分(例如文字部分)与背景成分区分开,然后针对资料成分加以处理。所以若能做好资料与背景的分离,则可简化其后的处理,并提高处理效率。尤其近来对影像处理应用上的须求,已发展到能在任意自然的照明环境下,也就是不需要刻意制造理想的照明环境下,也能做好正确的影像处理。这种要求与现有技术利用一封闭的理想照明环境,以取得理想的资料/背景灰度比,完全不同。如何在自然的照明环境下,取得合用的资料/背景辨认,或制造合用的资料/背景灰度比,已成为本领域专家的一大课题。从取像设备,如CCD(ChargeCoupledDevice)摄影机,所得到之影像,可视为一个二维平面。赋于直角座标系统,水平方向为X轴,垂直方向为Y轴,原点位于影像的左上角,如第1图所示。影像中,位于座标值(x,y)上的像素的灰角值,用g(x,y)来表示。令i(x,y)代表照明因子,而r(x,y)代表反射因子。则g(x,y)=i(x,y)×r(x,y)……(1)其中0<i(x,y)<∞0<r(x,y)<1在任意自然的照明条件下,即使文件的纸张平滑,印刷清晰精美,也就是r(x,y)不会在g(x,y)上造成杂讯,当照明的条件不理想,即i(x,y)在整个影像上并不一致时,则g(x,y)会受其影响,其结果如第2(b)图及第3(b)图所示。图中,(a)均表示在任意自然的照明条件下,由取像设备取得的影像资料,(b)则分别表示在其第180条及第120条水平扫描线上测得各点的灰度值。如第2(a)图及第3(a)图所示,取像设备取得的影像,其背景成分有部分较暗(灰值较低)。虽然各图的(b)均是代表背景成分的扫描灰度值,但其值变化幅度颇大。如以现有技术,利用单一分界值的方法,取一特定值作为判断资料/背景的依据,则此特定值将无法适用整个影像资料,而造成错误的结果。所以目前必须有一种方法,以在照明不理想的情形下,能随时调整分界值,并求消除照明不均匀所造成的影响。本专利技术的目的即在提供一种文件影像的资料与背景分离方法,以在照明不均匀的环境下,取得正确影像资料。本专利技术另一目的在提供一种消除照明条件不佳,对影像资料造成的劣化的方法。本专利技术另一目的,也在提供一种动态的影像资料/背景分离值的决定方法。根据照明设备的特性,在不加以刻意遮掩的情况下,其对影像灰度值所造成的影响,是接近平滑的及渐进的图不会有突然的大的差值。其情形亦如第2图及第3图所示。图中,显示两个在不理想的照明情况下取得的文件影像,以及一条不通过文字笔划的水平线上(也就是该水平线上的像素皆为背景,皆不属于文字),灰度值相对于x轴座标的变化曲线。由于该水平线不通过任何文字,其上的像素完全是属于背景,也就是白纸,所以其灰度值完全是由不理想的照明所产生。曲线由于受电子取像设备,光源入射角及纸张表面粗糙度影响,并非完全平滑,但仍可认为其变化是近似平滑且连续。根据“由不理想之照明,在灰度值上所造成之变化是近似平滑且连续”的结论,可以得知不理想的照明,为相邻两像素的灰度值所造成的差值是有限,且可以加以预估的。利用上述现象可以寻求以静态分界值或动态的分界值,将影像中的资料成分与背景成分加以分离,并据以处理。以下依据图式说明本专利技术之实施例。第1图表示由取像设备取得的二维影像座标系图。第2图表示不理想照明环境下取得文件影像及其特定扫描线上的灰度值变化曲线图。第3图表示不理想照明环境下取得另一文件影像及其特定扫描线上的灰度值变化曲线图。第4图表示文件影像资料及其文字资料笔划边缘的示意图。第5图表示本专利技术较佳实施例中f函数与R函数的关系图。第6图表示不理想照明环境下取得文件影像及其特定扫描线上所取得的灰度值与分界值曲线图。第7图表示不理想照明环境下取得另一文件及其特定扫描线上所取得的灰度值与分界值曲线图。第8图表示不理想照明环境下取得另一文件影像及其特定扫描线上所取得的灰度值与分界值曲线图。第9图表示利用本专利技术的方法处理不理想照明环境下取得的文件影像之结果。第10图表示利用本专利技术的方法处理不理想照明环境下取得的另一文件影像的结果。第11图表示利用本专利技术的方法处理不理想照明环境下取得的另一文件影像的结果。第12图表示利用本专利技术的方法处理不理想照明环境下取得的另一文件影像的结果。(A)将像素区分为“稳定态”与“转变态”的方法假设由取像设备取得之影像大小为N(pixel)×N(pixel)对于x方向上,相邻的两个像素的灰度值,定义一个差值的绝对值函数如下X_GDIF(x,y)=|g(x,y)-g(x-1,y)|-(2)X1,2,3,....,N-1Y0,2,3,....,N-1相同的,在y轴方向,也定义一个相同的函数如下Y_GDIF(x,y)=|g(x,y)-g(x,y-1)|-(3)X0,1,2,....,N-1Y1,2,3,....,N-1假设NX(i)表示X_GDIF(x,y)=i的像素的数目,NY(i)表示Y_GDIF(x,y)=i的像素的数目。M=N×(N-1)表示X_GDIF(x,y)或Y_GDIF(x,y)有定义的像素的数目。则X_GDIF(x,y)小于或等于i的像素总数,在整个文件像素中所占的比例,写成i的函数如下X-CFD(i)=k = 0iNX(k)/M]]>若在电脑中,以8bits来代表一个像素的灰度值,则i=0,1,2,…,255。同理,在y轴方向也有一个相对的函数Y-CFD(i)=k=0iNY(k)/M,i = 0,1,2,....,255]]>在一张文件影像中,属于文字笔划边缘的像素,在整张影像中所占的比例较小,如第4图所示。图中(a)是一个文件影像,(b)中,白色部分是文字笔划边缘的像素。根据统计的结果,可以得到一张文件影像中,属于文字笔划边缘的像素,在整张文件中所占的百分比不超过25%。换句话说,属于背景及非文字笔划边缘的像素,不少于75%,所以不理想之照明对文件影像中,两相邻像素号灰度值所造成之影响可以对X_GDIF(x,y)<i(或Y_GDIF(x,y)<=i),0<=i<=255,找到一个i,使得X_CFD(i)=75%(或Y_CFD(i)=75%)。换言之,对X_CFD(i)=75%(或Y_CFD(i)=75%)之部分做一统计分析,可得到灰度值变化的统计量。实验中,对18张文件影像做上述的统计,求得平均值,标准差,平均值加3倍标准差(取四舍五入值成整数),以及利用该平均值加3倍标准差调整而得的X_CFD(i)与Y_CFD(i)的值,如表一与表二所示。 +i是平均值加三倍标准差后取四舍五入值到整数 ++i是平均值加三倍标准差后取四舍五入值到整数在这些统计量中,平均值的平均值,标准差的平均值及平均值加3倍标准差的平均值,列于表中的最下面一列。从这个结果可以获得对某些特定样本适用的i值。令i=平均值加3倍标准差,则通常75%<=X_CFD(i)<=79%,75%<=Y_CFD(i)<=79%。前面已得知,属于背景与非文字笔划边缘的像素所占的比例不少于75%,所以可以将依统计所得本文档来自技高网...

【技术保护点】
一种辨认影像资料的方法,系用以决定数位化影像资料为背景或影像的方法,包括:将影像资料的第1像素假设为“背景”的步骤,由第1方向参考前像素的灰度值,辨别影像资料的像素系属稳定态或转变态的步骤,如该像素系属稳定态,则以稳定态像素分界值设定法设定的分界值判断该像素为背景或影像像素的步骤,及如该像素系属转变态,则以转变态像素分界值设定法设定的分界值判断该像素为背景或影像像素的步骤。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:许文星杨政道
申请(专利权)人:星友科技股份有限公司
类型:发明
国别省市:71[中国|台湾]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1