一种图像文字识别的方法及装置制造方法及图纸

技术编号：10362955 阅读：141 留言：0更新日期：2014-08-27 18:59

本发明专利技术涉及一种图像文字识别的方法及装置，包括将获取到的不同格式的文字图像进行图像解析生成格式统一的TIFF图像；对所述TIFF图像进行图像处理得到二值图像；对所述二值图像进行矢量转换，获取所述二值图像像素阵列对应的矢量数据；将所述矢量数据与预设的英文或汉字的矢量库进行模式匹配，获取匹配的文字结果。采用本发明专利技术提出的方法及装置，能够有效识别文档图像中的文字部分，方便图像文字文档的二次编辑和处理，实现对文档图像的识别速度快、效率高、准确率好、应用范围广的效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像文字识别的方法及装置
本专利技术涉及模式识别与图像处理
，尤其涉及一种图像文字识别的方法及装置。
技术介绍
图像二值化是指一种图像处理技术，它将灰度图像转化为单色图像，以便进行进一步的分析和处理。文档图像的应用越来越广泛，我们处理的第一步往往就是将文档图像进行二值化，在此基础上获得文字图像，再进行文字识别工作。随着计算机技术的迅速发展，以图像文件为主的多媒体文件成为信息交流的主体。日常生活中，利用扫描仪将文档图像扫描录入计算机，从而完成纸质文档自动录入的情形也越来越多，因为无论在速度方面还是在准确率方面，扫描录入的方式都比人工录入的方式更具有优势。然而，扫描录入的图片，在文档处理方面存在不易二次编辑，文字质量下降等诸多不足，这些方面的不足制约了扫描录入文档的应用范围，本专利技术的提出正好弥补了这些不足。本专利技术能够对扫描录入的图像的文字部分进行识别，扩大扫描录入文档的应用范围，方便对扫描录入文档的二次编辑和处理。
技术实现思路
(一 )要解决的技术问题本专利技术所要解决的技术问题是:如何有效地识别文档图像中的文字部分。( 二 )技术方案...
一种图像文字识别的方法及装置

【技术保护点】
一种图像文字识别的方法，其特征在于，该方法包括以下步骤：S1：将获取到的不同格式的文字图像进行图像解析生成格式统一的TIFF图像；S2：对所述TIFF图像进行图像处理得到二值图像；S3：对所述二值图像进行矢量转换，获取所述二值图像像素阵列对应的矢量数据；S4：将所述矢量数据与预设的英文或汉字的矢量库进行模式匹配，获取匹配的文字结果。

【技术特征摘要】
1.一种图像文字识别的方法，其特征在于，该方法包括以下步骤:51:将获取到的不同格式的文字图像进行图像解析生成格式统一的TIFF图像； 52:对所述TIFF图像进行图像处理得到二值图像；53:对所述二值图像进行矢量转换，获取所述二值图像像素阵列对应的矢量数据；54:将所述矢量数据与预设的英文或汉字的矢量库进行模式匹配，获取匹配的文字结果.2.根据权利要求1所述的方法，其特征在于，所述步骤SI具体包括: 511:获取待识别图像； 512:判断所述待识别图像是否为TIFF格式的图像； 513:如果不是，则对所述图像进行图像解析。3.根据权利要求1所述的方法，其特征在于，所述步骤S2具体包括: 521:判断所述TIFF图像是否为灰度图像，如果是则直接执行步骤S23 ； 522:如果不是，则对所述TIFF图像进行灰度化处理，生成灰度图像； 523:根据中值滤波法对所述灰度图像进行去噪处理； S24:根据最大类间方差法将去噪后的灰度图像进行二值化处理生成二值图像。4.根据权利要求3所述的方法，其特征在于，所述步骤S22具体包括: 读取待识别图像中每个像素点的R、G、B分量值，其中R代表彩色图像中红色分量值，G代表彩色图像中绿色分量值，B代表彩色图像中蓝色分量值；根据各分量值预设的权值，利用加权平均值法计算每个像素点的灰度值，生成灰度图像。5.根据权利要求3所述的方法，其特征在于，所述步骤S23具体包括: 创建一个3X3像素的模板；将所述模板在图像各个像素点上依次进行移动扫描；计算处于所述模板中所有像素点的灰度值的中间值；将当前模板中所有像素点的灰度值设置为所述中间值。6.根据权利要求3所述的方法，其特征在于，所述步骤S24具体包括: 根据最大类间方差法确定二值化处理的阈值T ；根据所述阈值T对所述去噪后的灰度图像进行二值化处理生成二值图像，所述二值图像的像素值如下: 7.根据权利要求1所述的方法，其特征在于，所述步骤S3具体包括: 531:统计所述二值图像中像素值为I的像素个数，从二值位图第O行O列开始...

【专利技术属性】
技术研发人员：喻民，姜建国，李敏，仇新梁，刘坤颖，刘超，黄超，王菲飞，胡波，赵双，王冉晴，
申请(专利权)人：中国科学院信息工程研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人