一种图片文字分割的方法技术

技术编号：2927283 阅读：1541 留言：0更新日期：2012-04-11 18:40

本发明专利技术提供了一种图片文字分割的方法，用于把图片文字检测的结果由文字区域图片转换成可以被ＯＣＲ软件识别的二值图片，包括以下步骤：（一）对文字区域图片进行颜色分量选择；在所选择的颜色分量上，文字最为清晰；（二）在步骤（一）选取的颜色分量上，对文字区域图片进行二值化；（三）对步骤（二）得到的二值图片进行去噪。本发明专利技术能自适应地选取有利于二值化的颜色分量，从而取得更好的二值化效果；同时利用基于颜色的聚类方法去除噪声，能够得到更为清晰，噪声较少的二值文字图片，从而得到更好的图片文字识别结果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于图像处理和检索
，具体涉及一种图片文字分割的方法。
技术介绍
随着互联网技术和多媒体技术的快速发展，互联网上的图片内容呈现爆炸性增长趋势，如何在这海量的图片内容中快速检索到想要的图片，成为了一个急需解决的关键问题。现有的方法主要基于图片对应网页中的文字描述信息，而没有深入到图片内容的分析中去。这种方法存在以下缺点(1 )如何在网页中找到能够准确描述图片内容的文字信息本身就是一件很困难的事情；(2)大量的图片没有对应的网页信息。另一方面，大量的图片含有文字信息，这些文字信息一般能准确描述图片的内容，如果能识别这些文字，用这些文字信息对图片进行索引和检索，必将大大推动互联网图片搜索技术的发展。因此，图片文字冲企测和识别技术具有十分重要的研究和应用价值。要对图片中的文字进行识别，先得把图片中的文字从背景中分割出来，转换成可供OCR软件识别的二值图片。图片文字分割方法主要包括两个部分二值化和去噪。现有方法主要采用了基于阈值的二值化方法，这种方法选择在彩色图片的固定颜色分量上进行二值化操作，但并不合理，因为对于某些颜色的文字图片来说，其它的颜色分量更适合于二值化，如果能够自适应地选择对二值化较好的颜色分量，将会有利于二值图片的生成；另外，现有的噪声去除方法主要利用了连通分量的几何特征和灰度值特征，然而，当噪声的这些特征和文字笔画都相似的时候，这种方法就失效了。另一方面，图片中含有丰富的彩色信息，文字笔画和噪声的颜色一般具有差异，通过对连通分量颜色特征的分析，可以有效地去除噪声。2005年在IEEE Tran...

【技术保护点】
一种图片文字分割的方法，用于把图片文字检测的结果由文字区域图片转换成可以被ＯＣＲ软件识别的二值图片，其特征在于，包括以下步骤：（１）对文字区域图片进行颜色分量选择，在所选择的颜色分量上，文字最为清晰；（２）在步骤（１）选取的颜色分量上，对文字区域图片进行二值化，得到二值图片；（３）对步骤（２）得到的二值图片进行去噪。

【技术特征摘要】

【专利技术属性】
技术研发人员：易剑，彭宇新，肖建国，
申请(专利权)人：北京大学，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人