一种图片的二值化方法、装置及终端制造方法及图纸

技术编号:15691499 阅读:102 留言:0更新日期:2017-06-24 04:45
本发明专利技术公开一种图片的二值化方法、装置及终端。本发明专利技术仅需将待处理图像通过各种互补性强的二值化方法分别独立处理,然后通过使用基于光学字符识别的学习引擎得到单个文字的置信度,进而计算文字置信度,即可动态选择最优的处理结果。不需要关心全局信息或局部纹理,即可实现各种二值化方法的处理结果的无缝切换。本发明专利技术能够在不同场景中动态选择最优的二值化结果从而满足不同场景的多样性需求,实现了对于图片二值化的全场景适配。

Two value method, device and terminal for picture

The invention discloses a two value method, a device and a terminal of an image. The invention only needs to be processed through a variety of highly complementary image binarization method respectively, and then through the use of optical character recognition engine based on learning confidence of individual characters, and then calculates the text confidence, can dynamically select the optimal processing results. Without the care of global information or local texture, seamless handover of processing results of various two valued methods can be realized. The invention can dynamically select the optimum two value result in different scenes, thus satisfying the diversity requirement of different scenes, and realizing the full scene adaptation of two valued pictures.

【技术实现步骤摘要】
一种图片的二值化方法、装置及终端
本专利技术涉及图像处理领域,尤其涉及一种图片的二值化方法、装置及终端。
技术介绍
图像的二值化,就是将图像上的像素点的灰度值设置为0或255,从而将整个图像呈现出明显的只有黑和白的视觉效果。二值化是图像处理的基本操作,其应用非常广泛,相应地,现有技术中也有相当多的二值化方法,比如双峰法、P参数法、迭代法和最大类间方差法等。然而,现有的二值化方案,都是基于固定规则的图片场景对图片进行二值化,不具有普适性,因此目前还没有适配所有场景的二值化方法。二值化方法的多样性和每个二值化方法的局限性导致了在需要对多种场景的图片进行二值化时,难以快速找到适合的二值化方法,从而影响了图片的二值化效果。
技术实现思路
为了解决上述技术问题,本专利技术提出了一种图片的二值化方法、装置及终端。本专利技术具体是以如下技术方案实现的:第一方面,提供了一种图片的二值化方法,所述方法包括:获取待处理图片,所述待处理图片中包含文字;分别使用多个预设的二值化处理方法对所述待处理图片进行独立的二值化处理,每个二值化方法得到一个处理结果;根据所述处理结果,得到处理结果集合;计算所述处理结果集合中的每一个处理结果的文字置信度;选取文字置信度最高的处理结果作为对所述待处理图片的二值化结果。第二方面,提供了一种图片的二值化装置,所述装置包括:待处理图片获取模块,用于获取待处理图片;处理结果得到模块,用于分别使用多个预设的二值化处理方法对所述待处理图片进行独立的二值化处理,每个二值化方法得到一个处理结果;处理结果集合得到模块,用于根据所述处理结果,得到处理结果集合;文字置信度计算模块,用于计算所述处理结果集合中的每一个处理结果的文字置信度;二值化结果得到模块,用于选取文字置信度最高的处理结果作为对所述待处理图片的二值化结果。第三方面,提供了一种图片的二值化终端,所述终端包括上述的一种图片的二值化装置。本专利技术的一种图片的二值化方法、装置及终端,具有如下有益效果:本专利技术基于光学字符识别计算对于待处理图片二值化结果的文字置信度,并根据文字置信度动态选择最优的二值化方法,从而获取对于待处理图片的最优二值化结果。本专利技术能够在不同场景中动态选择最优的二值化结果从而满足不同场景的多样性需求,实现了对于图片二值化的全场景适配。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。图1是本专利技术实施例提供的一种图片的二值化方法的流程图;图2是本专利技术实施例提供的文字置信度的获取方法流程图;图3是本专利技术实施例提供的加权平均值算法的流程图;图4是本专利技术实施例提供的基于滑动窗的二值化方法的流程图;图5是本专利技术实施例提供的局部二值化方法的流程图;图6是本专利技术实施例提供的基于颜色值统计的二值化方法的流程图;图7是本专利技术实施例提供的卷积神经网络的结构图;图8是本专利技术实施例提供的一张待处理图片;图9是本专利技术实施例提供的基于滑动窗的二值化方法对于图8中的待处理图片的处理结果;图10是本专利技术实施例提供的基于颜色值统计的二值化方法对于图8中的待处理图片的处理结果;图11是本专利技术实施例提供的另一张待处理图片;图12是本专利技术实施例提供的基于滑动窗的二值化方法对于图11中的待处理图片的处理结果;图13是本专利技术实施例提供的基于颜色值统计的二值化方法对于图11中的待处理图片的处理结果;图14是本专利技术实施例提供的一种图片的二值化装置的框图;图15是本专利技术实施例提供的文字置信度计算单元的框图;图16是本专利技术实施例提供的处理结果得到模块的框图;图17是本专利技术实施例提供的滑动窗二值化单元的框图;图18是本专利技术实施例提供的颜色值统计二值化单元的框图;图19是本专利技术实施例提供的终端的结构框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参考图1,其示出了本专利技术一个实施例提供的一种图片的二值化方法的流程图。该方法可以包括如下步骤。步骤101,获取待处理图片,所述待处理图片中包含文字。步骤102,分别使用多个预设的二值化处理方法对所述待处理图片进行独立的二值化处理,每个二值化方法得到一个处理结果。预设的二值化方法可以选择现有的二值化方法,预设的二值化方法的数量可以为二个或二个以上。现有的二值化方法主要分为两类,一类是全局方法,以全局视角确定统一的分割阈值,通过分割阈值进行二值化;另一类是局部自适应的方法,根据图像不同区域的情况,确定不同的阈值并根据所述阈值进行二值化。全局方法大多根据图像的全局颜色统计信息,计算出一个能取得最大二值化效果的分割阈值,然后根据所述分割阈值进行简单的二值化。这种方法仅在背景简单且颜色单一的图像中效果较好,对纹理信息复杂或低对比度的图像效果较差。局部自适应方法大多根据局部纹理信息来计算二值化阈值,在一定程度上可以避免全局阈值的误判,但是由此经常由于过于注重于局部信息,忽略全局统筹信息,而常常造成相邻的局部二值化效果迥异,相邻区域二值化效果不连贯的问题。可见,现有的二值化方法都只能处理固定场景,自适应能力不强。为优化图像的二值化效果,提高步骤101中的待处理图片中的文字提取的准确度,在步骤102中可以枚举多种二值化方法,并通过后续计算的文字置信度来选择最佳的二值化方法,从而起到集各种二值化方法之所长、取长补短的效果,进而扩展图片的二值化场景,并且获取最佳的二值化效果。步骤103,根据所述处理结果,得到处理结果集合。在步骤102中枚举多种二值化方法,每个二值化方法得到一个处理结果,从而构成了处理结果集合。步骤104,计算所述处理结果集合中的每一个处理结果的文字置信度。所述文字置信度用于表征所述处理结果中的文字能够被准确识别的概率,所述文字置信度可以作为二值化方法的处理效果的评价指标。文字置信度高,则说明二值化处理效果理想,文字置信度低,则说明二值化处理效果不理想。步骤105,选取文字置信度最高的处理结果作为对所述待处理图片的二值化结果。若存在文字置信度最高的处理结果有多个的时候,则按照预设的选择方法在所述处理结果中选择一个作为对所述待处理图片的二值化结果。所述预设的选择方法可以为随机选择或其它选择方法。本专利技术实施例通过枚举多种二值化方法并动态选择最优的处理结果的方式,从而可以对各个场景的图片均能够进行二值化处理,并取得较好的二值化效果,从而提高了对于图片处理的兼容性;以文字置信度作为图片二值化效果的评价标准,可以使得选出的处理结果获取最好的文字识别结果,有利于后期对于所述结果进行其它的文字处理。进一步地,请参考图2,其示出了步骤104中的文字置信度的获取方法流程图,包括:步骤1041,获取处理结果中每一个文字的置信度。具体地,通过将所述处理结果输入预设的基于光学字符识别(OpticalCharacterRecognition,OCR本文档来自技高网...
一种图片的二值化方法、装置及终端

【技术保护点】
一种图片的二值化方法,其特征在于,所述方法包括:获取待处理图片,所述待处理图片中包含文字;分别使用多个预设的二值化处理方法对所述待处理图片进行独立的二值化处理,每个二值化方法得到一个处理结果;根据所述处理结果,得到处理结果集合;计算所述处理结果集合中的每一个处理结果的文字置信度;选取文字置信度最高的处理结果作为对所述待处理图片的二值化结果。

【技术特征摘要】
1.一种图片的二值化方法,其特征在于,所述方法包括:获取待处理图片,所述待处理图片中包含文字;分别使用多个预设的二值化处理方法对所述待处理图片进行独立的二值化处理,每个二值化方法得到一个处理结果;根据所述处理结果,得到处理结果集合;计算所述处理结果集合中的每一个处理结果的文字置信度;选取文字置信度最高的处理结果作为对所述待处理图片的二值化结果。2.根据权利要求1所述的方法,其特征在于,所述计算所述处理结果集合中的每一个处理结果的文字置信度包括:获取处理结果中每一个文字的置信度;根据预设的文字置信度算法和每一个文字的置信度计算所述处理结果的文字置信度。3.根据权利要求2所述的方法,其特征在于,所述获取处理结果中每一个文字的置信度包括:将所述处理结果输入预设的基于光学字符识别的学习引擎;得到所述学习引擎输出的置信度。4.根据权利要求2所述的方法,其特征在于,所述根据预设的文字置信度算法和每一个文字的置信度计算所述处理结果的文字置信度包括:设定处理结果中每一个文字对应的权值;计算所述处理结果的加权平均置信度:根据每一个文字的置信度和所述文字对应的权值对置信度进行加权求和;由加权求和的结果除以所述处理结果中的文字的数量得到加权平均置信度;将所述加权平均置信度作为文字置信度。5.根据权利要求1所述的方法,其特征在于,所述预设的二值化处理方法包括基于滑动窗的二值化方法和基于颜色值统计的二值化方法。6.根据权利要求5所述的方法,其特征在于,所述基于滑动窗的二值化方法包括:将窗口设置于所述待处理图片的预设位置;判断所述窗口内的像素与相关像素是否属于连续的图案;所述相关像素为窗口外与所述窗口相邻的像素;若否,则对所述窗口内的像素进行局部二值化;判断所述窗口是否到达所述预设轨迹的终点;若否,则按照预设轨迹滑动所述窗口;返回判断所述窗口内的像素与窗口外的相邻像素是否属于连续的图案的步骤。7.根据权利要求6所述的方法,其特征在于,所述局部二值化包括:得到窗口内的像素的颜色分布统计结果;根据所述统计结果设定阈值,所述阈值用于区分所述待处理图片的前景和背景;根据所述阈值对所述窗口内的像素进行二值化。8.根据权利要求5所述的方法,其特征在于,所述基于颜色值统计的二值化方法包括:得到所述待处理图片的像素的颜色分布统计结果;基于所述颜色分布统计结果,使用预设的颜色聚类算法得到两个目标颜色;根据所述两个目标颜色设定前景颜色和背景颜色;依次计算所述待处理图片的像素的第一距离和第二距离,并根据计算结果判定所述像素的归属;所述第一距离为所述像素的颜色与所述前景颜色之间的欧几里得距离,所述第二距离为所述像素颜色与所述背景颜色之间的欧几里得距离;根据所述判定结果对所述待处理图片中的像素进行二值化。9.根据权利要求8所述的方法,其特征在于,所述依次计算所述待处理图片的像素的第...

【专利技术属性】
技术研发人员:刘银松郭安泰
申请(专利权)人:腾讯科技上海有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1