当前位置: 首页 > 专利查询>清华大学专利>正文

基于光学字符识别的图像中字符识别方法及装置制造方法及图纸

技术编号:10877900 阅读:168 留言:0更新日期:2015-01-08 00:15
本发明专利技术涉及一种基于光学字符识别的图像中字符识别方法及装置,所述方法在一个实施例中包括以下步骤:将所述图像灰度化转化为灰度图像;滑动读取图像的窗口,循环截取预设范围的所述灰度图像直到所述图像被完全截取;根据预设的计算方法计算得到的第一阀值对当前所述截取的预设范围的图像进行二值化直到所述灰度图像被完全二值化;将所述二值化的灰度图像的灰度值离散分布通过离散傅里叶变换变换到频域,通过高斯滤波对所述频域中的点值进行调整;再将所述频域中距离中心距离小于预设值的点值均置为零,得到处理图像;将所述处理图像中的字符串进行识别,生成目标字符串。根据发明专利技术中的方法及装置,可以更准确的识别图像中的字符串。

【技术实现步骤摘要】
基于光学字符识别的图像中字符识别方法及装置
本专利技术涉及光学字符识别领域,特别涉及一种基于光学字符识别的图像中字符识 别方法及装置。
技术介绍
图像中的字符的识别技术越来越重要,通过扫描识别影像直接获取影像中的字 符,减少字符输入的麻烦操作。光学字符识别技术已经应用到诸如车牌识别、证件信息识 另IJ、取词翻译等。现有技术中没有对于图像中有明显摩尔纹等明显阴影的字符识别的有效 方法,对于不清晰的图像中的字符识别也就成为亟待解决的问题。
技术实现思路
有鉴于此,本专利技术提供一种基于光学字符识别的图像中字符识别方法及装置,可 以更准确的识别图像中的字符串。 一种基于光学字符识别的图像中字符识别方法,所述方法用于读取图像中的字符 串,所述方法包括以下步骤: 将所述图像灰度化转化为灰度图像; 滑动读取图像的窗口,循环截取预设范围的所述灰度图像直到所述图像被完全截 取; 根据预设的计算方法计算得到的第一阀值对当前所述截取的预设范围的图像进 行二值化直到所述灰度图像被完全二值化; 将所述二值化的灰度图像的灰度值的离散分布通过离散傅里叶变换变换到频域, 通过高斯滤波对所述频域中的点值进行调整; 再将所述频域中距离中心距离小于预设值的点值均置为零,得到处理图像;以及 将所述处理图像中的字符串进行识别,生成目标字符串。 一种基于光学字符识别的图像中字符识别装置,所述装置用于读取图像中的字符 串,所述装置包括以下模块: 二值化模块,用于根据灰度化将所述图像转化为灰度图像,滑动读取图像的窗口, 循环截取预设范围的所述图像直到所述图像被完全截取,根据预设的计算方法计算得到的 第一阀值将当前所述截取的图像进行二值化; 滤波模块,用于将所述二值化的灰度图像的灰度值的离散分布通过离散傅里叶变 换变换到频域,通过高斯滤波对所述频域中的点值进行调整; 截断模块,用于再将所述频域中距离中心距离小于预设值的点值均置为零,得到 处理图像;以及 识别模块,用于将所述处理图像中的字符串进行识别,生成目标字符串。 根据上述实施例的方法及装置,通过先对图像预处理,减少较明显阴影的影响,有 效识别图像中的字符串。 为让本专利技术的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例, 并配合所附图式,作详细说明如下。 【附图说明】 图1为一种电子装置的结构框图。 图2为第一实施例提供的基于光学字符识别的图像中字符识别方法流程图。 图3为第二实施例提供的基于光学字符识别的图像中字符识别方法流程图。 图4为第三实施例提供的基于光学字符识别的图像中字符识别方法流程图。 图5为第四实施例提供的基于光学字符识别的图像中字符识别方法流程图。 图6为第五实施例提供的基于光学字符识别的图像中字符识别方法流程图。 图7为第六实施例提供的基于光学字符识别的图像中字符识别方法流程图。 图8为第七实施例提供的基于光学字符识别的图像中字符识别装置结构框图。 图9为第八实施例提供的基于光学字符识别的图像中字符识别装置结构框图。 图10为第九实施例提供的基于光学字符识别的图像中字符识别装置结构框图。 图11为第十实施例提供的基于光学字符识别的图像中字符识别装置结构框图。 图12为第十一实施例提供的基于光学字符识别的图像中字符识别装置结构框 图。 图13为第十二实施例提供的基于光学字符识别的图像中字符识别装置结构框 图。 【具体实施方式】 为更进一步阐述本专利技术为实现预定专利技术目的所采取的技术手段及功效,以下结合 附图及较佳实施例,对依据本专利技术的【具体实施方式】、结构、特征及其功效,详细说明如后。 本专利技术实施例涉及一种基于光学字符识别的图像中字符识别方法及装置,其可用 于一种电子装置中。 图1为上述电子装置的结构框图。如图1所示,电子装置100包括一个或多个(图 中仅示出一个)处理器102、存储器104、RF (Radio Frequency,射频)模块106、网络模块 108、传感器110、摄像模块112、输入模块114、显示模块116、。本领域普通技术人员可以理 解,图1所示的结构仅为示意,其并不对电子装置1〇〇的结构造成限定。例如,电子装置1〇〇 还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。上述的电 子装置100的具体实例包括但并不限于手持式计算机、移动电话、媒体播放器、车载设备、 个人数字助理及前述装置的各种组合。 本领域普通技术人员可以理解,相对于处理器102来说,所有其他的组件均属于 外设,处理器102与这些外设之间通过多个外设接口 124相耦合。外设接口 124可基于以下 标准实现:通用异步接收 / 发送装置(Universal Asynchronous Receiver/Transmitter, UART)、通用输入 / 输出(General Purpose Input Output, GPI0)、串行外设接口(Serial Peripheral Interface, SPI)、内部集成电路(Inter-Integrated Circuit,I2C),但不并限 于上述标准。在一些实例中,外设接口 124可仅包括总线;在另一些实例中,外设接口 124 还可包括其他元件,如一个或者多个控制器,例如用于连接液晶显示面板的显示控制器或 者用于连接存储器的存储控制器122。此外,这此控制器还可以从外设接口 124中脱离出 来,而集成于处理器102内或者相应的外设内。 存储器104可用于存储软件程序以及模块,如本专利技术实施例中的基于光学字符识 别的图像中字符识别方法/装置对应的程序指令/模块,处理器102通过运行存储在存储 器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的基于 光学字符识别的图像中字符识别方法。存储器104可包括高速随机存储器,还可包括非易 失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些 实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可 以通过网络连接至电子装置100。上述网络的实例包括但不限于互联网、企业内部网、局域 网、移动通信网及其组合。 RF模块106用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与 通讯网络或者其他设备进行通讯。RF模块106可包括各种现有的用于执行这些功能的电 路元件,例如,天线、射频收发器、数字信号处理器、加密/解密芯片、用户身份模块(SM) 卡、存储器等等。RF模块106可与各种网络如互联网、企业内部网、无线网络进行通讯或 者通过无线网络与其他设备进行通讯。上述的无线网络可包括蜂窝式电话网、无线局域网 或者城域网。上述的无线网络可以使用各种通信标准、协议及技术,包括但并不限于全球 移动通信系统(Global System for Mobile Communication, GSM)、增强型移动通信技术 (Enhanced Data GSM Environment, EDGE),宽带码分多址技术(wideband code 本文档来自技高网...
基于光学字符识别的图像中字符识别方法及装置

【技术保护点】
一种基于光学字符识别的图像中字符识别方法,所述方法用于读取图像中的字符串,其特征在于,所述方法包括以下步骤:将所述图像转化为灰度图像;滑动读取图像的窗口,截取预设范围的所述灰度图像直到所述图像被完全截取;根据第一阀值对当前所述截取的预设范围的图像进行二值化直到所述灰度图像被完全二值化;将所述二值化的灰度图像的灰度值离散分布变换到频域,通过滤波对所述频域中的点值进行调整;将所述频域中距离中心距离小于预设值的点值均置为零,得到处理图像;以及将所述处理图像中的字符串进行识别,生成目标字符串。

【技术特征摘要】
1. 一种基于光学字符识别的图像中字符识别方法,所述方法用于读取图像中的字符 串,其特征在于,所述方法包括以下步骤: 将所述图像转化为灰度图像; 滑动读取图像的窗口,截取预设范围的所述灰度图像直到所述图像被完全截取; 根据第一阀值对当前所述截取的预设范围的图像进行二值化直到所述灰度图像被完 全二值化; 将所述二值化的灰度图像的灰度值离散分布变换到频域,通过滤波对所述频域中的点 值进行调整; 将所述频域中距离中心距离小于预设值的点值均置为零,得到处理图像;以及 将所述处理图像中的字符串进行识别,生成目标字符串。2. 如权利要求1所述的基于光学字符识别的图像中字符识别方法,其特征在于,所述 将所述二值化的灰度图像的灰度值离散分布变换到频域,通过滤波对所述频域中的点值进 行调整具体为: 通过离散傅里叶变换将所述二值化的灰度图像的灰度值离散分布变换到频域; 通过高斯滤波对所述频域中的点值进行调整。3. 如权利要求1所述的基于光学字符识别的图像中字符识别方法,其特征在于,在所 述根据光学字符识别进行识别所述图像中字符串之后还包括: 计算所述图像中字符串顶部与图像顶部的距离,若所述距离小于第二阀值则将所述字 符串删除; 计算所述图像中字符串底部与图像底部的距离,若所述距离小于所述第二阀值则将所 述字符串删除。4. 如权利要求1所述的基于光学字符识别的图像中字符识别方法,其特征在于, 若所述图像包括至少两张字符串图像时,将所述相邻两张图像字符串段落进行从上至 下遍历进行多行匹配; 计算单行匹配成功的行数占总行数的比例; 若所述比例超过第三阀值,则判断此次多行匹配成功; 比较所有匹配成功的多行匹配的行数,行数最多的所述多行匹配为最终匹配段,将所 述最终匹配段删除; 将删除最终匹配段之后的相邻段字符串进行拼接。5. 如权利要求1所述的基于光学字符识别的图像中字符识别方法,其特征在于,若所 述图像中字符串为代码,所述方法还包括,在所述光学字符识别的识别引擎库中根据所述 代码设置白名单。6. 如权利要求1所述的基于光学字符识别的图像中字符识别方法,其特征在于,在所 述根据光学字符识别进行识别所述图像中字符串之后还包括: 根据所述图像中字符串的包围盒的信息计算图像中字符串的行高与字符串的宽度计 算得到所述图像中字符串的之间的空白数; 根据所述计算得到的字符之间的空白数,调整所述目标字符串的格式。7. 如权利要求6所述的基于光学字符识别的图像中字符识别方法,其特征在于,在所 述根据光学字符识别进行识别所述图像中字符串,生成目标字符串之后还包括, 将所述格式调整之后的目标字符串进行1?壳。8. 如权利要求1所述的基于光学字符识别的图像中字符识别方法,其特征在于,当所 述图像中的字符串包括代码与英文,在所述根据光学字符识别进行识别所述图像中字符串 之后还包括: 计算当前行的字符串为代码的概率; 若所述概率超过第四阀值,判断为代码,则对所述判断为代码的区域作标记。9. 一种基于光学字符识别的图像中字符识别装置,所述装置用于读取图像中的字符 串,其特征在于,所述装置包括以下模块: 二值化模块,用于将所述图像转化为灰度图像,滑动读取图像的窗口,截取预设范围的 所述图像直到所述图像被完全截取,...

【专利技术属性】
技术研发人员:李德斌王巨宏许勇全琦黄志斌杨大威谭志鹏吴现杨言
申请(专利权)人:清华大学腾讯科技深圳有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1