一种图片的二值化方法、装置及终端制造方法及图纸

技术编号：15691499 阅读：122 留言：0更新日期：2017-06-24 04:45

本发明专利技术公开一种图片的二值化方法、装置及终端。本发明专利技术仅需将待处理图像通过各种互补性强的二值化方法分别独立处理，然后通过使用基于光学字符识别的学习引擎得到单个文字的置信度，进而计算文字置信度，即可动态选择最优的处理结果。不需要关心全局信息或局部纹理，即可实现各种二值化方法的处理结果的无缝切换。本发明专利技术能够在不同场景中动态选择最优的二值化结果从而满足不同场景的多样性需求，实现了对于图片二值化的全场景适配。

Two value method, device and terminal for picture

The invention discloses a two value method, a device and a terminal of an image. The invention only needs to be processed through a variety of highly complementary image binarization method respectively, and then through the use of optical character recognition engine based on learning confidence of individual characters, and then calculates the text confidence, can dynamically select the optimal processing results. Without the care of global information or local texture, seamless handover of processing results of various two valued methods can be realized. The invention can dynamically select the optimum two value result in different scenes, thus satisfying the diversity requirement of different scenes, and realizing the full scene adaptation of two valued pictures.

全部详细技术资料下载

【技术实现步骤摘要】
一种图片的二值化方法、装置及终端
本专利技术涉及图像处理领域，尤其涉及一种图片的二值化方法、装置及终端。
技术介绍
图像的二值化，就是将图像上的像素点的灰度值设置为0或255，从而将整个图像呈现出明显的只有黑和白的视觉效果。二值化是图像处理的基本操作，其应用非常广泛，相应地，现有技术中也有相当多的二值化方法，比如双峰法、P参数法、迭代法和最大类间方差法等。然而，现有的二值化方案，都是基于固定规则的图片场景对图片进行二值化，不具有普适性，因此目前还没有适配所有场景的二值化方法。二值化方法的多样性和每个二值化方法的局限性导致了在需要对多种场景的图片进行二值化时，难以快速找到适合的二值化方法，从而影响了图片的二值化效果。
技术实现思路
为了解决上述技术问题，本专利技术提出了一种图片的二值化方法、装置及终端。本专利技术具体是以如下技术方案实现的：第一方面，提供了一种图片的二值化方法，所述方法包括：获取待处理图片，所述待处理图片中包含文字；分别使用多个预设的二值化处理方法对所述待处理图片进行独立的二值化处理，每个二值化方法得到一个处理结果；根据所述处理结果，得到处理结果集合；计算所述处理结果集合中的每一个处理结果的文字置信度；选取文字置信度最高的处理结果作为对所述待处理图片的二值化结果。第二方面，提供了一种图片的二值化装置，所述装置包括：待处理图片获取模块，用于获取待处理图片；处理结果得到模块，用于分别使用多个预设的二值化处理方法对所述待处理图片进行独立的二值化处理，每个二值化方法得到一个处理结果；处理结果集合得到模块，用于根据所述处理结果，得到处理结果集合；文字置信度...
一种图片的二值化方法、装置及终端

【技术保护点】
一种图片的二值化方法，其特征在于，所述方法包括：获取待处理图片，所述待处理图片中包含文字；分别使用多个预设的二值化处理方法对所述待处理图片进行独立的二值化处理，每个二值化方法得到一个处理结果；根据所述处理结果，得到处理结果集合；计算所述处理结果集合中的每一个处理结果的文字置信度；选取文字置信度最高的处理结果作为对所述待处理图片的二值化结果。

【技术特征摘要】
1.一种图片的二值化方法，其特征在于，所述方法包括：获取待处理图片，所述待处理图片中包含文字；分别使用多个预设的二值化处理方法对所述待处理图片进行独立的二值化处理，每个二值化方法得到一个处理结果；根据所述处理结果，得到处理结果集合；计算所述处理结果集合中的每一个处理结果的文字置信度；选取文字置信度最高的处理结果作为对所述待处理图片的二值化结果。2.根据权利要求1所述的方法，其特征在于，所述计算所述处理结果集合中的每一个处理结果的文字置信度包括：获取处理结果中每一个文字的置信度；根据预设的文字置信度算法和每一个文字的置信度计算所述处理结果的文字置信度。3.根据权利要求2所述的方法，其特征在于，所述获取处理结果中每一个文字的置信度包括：将所述处理结果输入预设的基于光学字符识别的学习引擎；得到所述学习引擎输出的置信度。4.根据权利要求2所述的方法，其特征在于，所述根据预设的文字置信度算法和每一个文字的置信度计算所述处理结果的文字置信度包括：设定处理结果中每一个文字对应的权值；计算所述处理结果的加权平均置信度：根据每一个文字的置信度和所述文字对应的权值对置信度进行加权求和；由加权求和的结果除以所述处理结果中的文字的数量得到加权平均置信度；将所述加权平均置信度作为文字置信度。5.根据权利要求1所述的方法，其特征在于，所述预设的二值化处理方法包括基于滑动窗的二值化方法和基于颜色值统计的二值化方法。6.根据权利要求5所述的方法，其特征在于，所述基于滑动窗的二值化方法包括：将窗口设置于所述待处理图片的预设位置；判断所述窗口内的像素与相关像素是否属于连续的图案；所述相关像素为窗口外与所述窗口相邻的像素；若否，则对所述窗口内的像素进行局部二值化；判断所述窗口是否到达所述预设轨迹的终点；若否，则按照预设轨迹滑动所述窗口；返回判断所述窗口内的像素与窗口外的相邻像素是否属于连续的图案的步骤。7.根据权利要求6所述的方法，其特征在于，所述局部二值化包括：得到窗口内的像素的颜色分布统计结果；根据所述统计结果设定阈值，所述阈值用于区分所述待处理图片的前景和背景；根据所述阈值对所述窗口内的像素进行二值化。8.根据权利要求5所述的方法，其特征在于，所述基于颜色值统计的二值化方法包括：得到所述待处理图片的像素的颜色分布统计结果；基于所述颜色分布统计结果，使用预设的颜色聚类算法得到两个目标颜色；根据所述两个目标颜色设定前景颜色和背景颜色；依次计算所述待处理图片的像素的第一距离和第二距离，并根据计算结果判定所述像素的归属；所述第一距离为所述像素的颜色与所述前景颜色之间的欧几里得距离，所述第二距离为所述像素颜色与所述背景颜色之间的欧几里得距离；根据所述判定结果对所述待处理图片中的像素进行二值化。9.根据权利要求8所述的方法，其特征在于，所述依次计算所述待处理图片的像素的第...

【专利技术属性】
技术研发人员：刘银松，郭安泰，
申请(专利权)人：腾讯科技上海有限公司，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人