【技术实现步骤摘要】
基于光学字符识别的图像中字符识别方法及装置
本专利技术涉及光学字符识别领域,特别涉及一种基于光学字符识别的图像中字符识 别方法及装置。
技术介绍
图像中的字符的识别技术越来越重要,通过扫描识别影像直接获取影像中的字 符,减少字符输入的麻烦操作。光学字符识别技术已经应用到诸如车牌识别、证件信息识 另IJ、取词翻译等。现有技术中没有对于图像中有明显摩尔纹等明显阴影的字符识别的有效 方法,对于不清晰的图像中的字符识别也就成为亟待解决的问题。
技术实现思路
有鉴于此,本专利技术提供一种基于光学字符识别的图像中字符识别方法及装置,可 以更准确的识别图像中的字符串。 一种基于光学字符识别的图像中字符识别方法,所述方法用于读取图像中的字符 串,所述方法包括以下步骤: 将所述图像灰度化转化为灰度图像; 滑动读取图像的窗口,循环截取预设范围的所述灰度图像直到所述图像被完全截 取; 根据预设的计算方法计算得到的第一阀值对当前所述截取的预设范围的图像进 行二值化直到所述灰度图像被完全二值化; 将所述二值化的灰度图像的灰度值的离散分布通过离散傅里叶变换变换到频域, 通过高斯滤波对所述频域中的点值进行调整; 再将所述频域中距离中心距离小于预设值的点值均置为零,得到处理图像;以及 将所述处理图像中的字符串进行识别,生成目标字符串。 一种基于光学字符识别的图像中字符识别装置,所述装置用于读取图像中的字符 串,所述装置包括以下模块: 二值化模块,用于根据灰度化将所述图像转化为灰度图像,滑动读取图像的窗口, 循环截取 ...
【技术保护点】
一种基于光学字符识别的图像中字符识别方法,所述方法用于读取图像中的字符串,其特征在于,所述方法包括以下步骤:将所述图像转化为灰度图像;滑动读取图像的窗口,截取预设范围的所述灰度图像直到所述图像被完全截取;根据第一阀值对当前所述截取的预设范围的图像进行二值化直到所述灰度图像被完全二值化;将所述二值化的灰度图像的灰度值离散分布变换到频域,通过滤波对所述频域中的点值进行调整;将所述频域中距离中心距离小于预设值的点值均置为零,得到处理图像;以及将所述处理图像中的字符串进行识别,生成目标字符串。
【技术特征摘要】
1. 一种基于光学字符识别的图像中字符识别方法,所述方法用于读取图像中的字符 串,其特征在于,所述方法包括以下步骤: 将所述图像转化为灰度图像; 滑动读取图像的窗口,截取预设范围的所述灰度图像直到所述图像被完全截取; 根据第一阀值对当前所述截取的预设范围的图像进行二值化直到所述灰度图像被完 全二值化; 将所述二值化的灰度图像的灰度值离散分布变换到频域,通过滤波对所述频域中的点 值进行调整; 将所述频域中距离中心距离小于预设值的点值均置为零,得到处理图像;以及 将所述处理图像中的字符串进行识别,生成目标字符串。2. 如权利要求1所述的基于光学字符识别的图像中字符识别方法,其特征在于,所述 将所述二值化的灰度图像的灰度值离散分布变换到频域,通过滤波对所述频域中的点值进 行调整具体为: 通过离散傅里叶变换将所述二值化的灰度图像的灰度值离散分布变换到频域; 通过高斯滤波对所述频域中的点值进行调整。3. 如权利要求1所述的基于光学字符识别的图像中字符识别方法,其特征在于,在所 述根据光学字符识别进行识别所述图像中字符串之后还包括: 计算所述图像中字符串顶部与图像顶部的距离,若所述距离小于第二阀值则将所述字 符串删除; 计算所述图像中字符串底部与图像底部的距离,若所述距离小于所述第二阀值则将所 述字符串删除。4. 如权利要求1所述的基于光学字符识别的图像中字符识别方法,其特征在于, 若所述图像包括至少两张字符串图像时,将所述相邻两张图像字符串段落进行从上至 下遍历进行多行匹配; 计算单行匹配成功的行数占总行数的比例; 若所述比例超过第三阀值,则判断此次多行匹配成功; 比较所有匹配成功的多行匹配的行数,行数最多的所述多行匹配为最终匹配段,将所 述最终匹配段删除; 将删除最终匹配段之后的相邻段字符串进行拼接。5. 如权利要求1所述的基于光学字符识别的图像中字符识别方法,其特征在于,若所 述图像中字符串为代码,所述方法还包括,在所述光学字符识别的识别引擎库中根据所述 代码设置白名单。6. 如权利要求1所述的基于光学字符识别的图像中字符识别方法,其特征在于,在所 述根据光学字符识别进行识别所述图像中字符串之后还包括: 根据所述图像中字符串的包围盒的信息计算图像中字符串的行高与字符串的宽度计 算得到所述图像中字符串的之间的空白数; 根据所述计算得到的字符之间的空白数,调整所述目标字符串的格式。7. 如权利要求6所述的基于光学字符识别的图像中字符识别方法,其特征在于,在所 述根据光学字符识别进行识别所述图像中字符串,生成目标字符串之后还包括, 将所述格式调整之后的目标字符串进行1?壳。8. 如权利要求1所述的基于光学字符识别的图像中字符识别方法,其特征在于,当所 述图像中的字符串包括代码与英文,在所述根据光学字符识别进行识别所述图像中字符串 之后还包括: 计算当前行的字符串为代码的概率; 若所述概率超过第四阀值,判断为代码,则对所述判断为代码的区域作标记。9. 一种基于光学字符识别的图像中字符识别装置,所述装置用于读取图像中的字符 串,其特征在于,所述装置包括以下模块: 二值化模块,用于将所述图像转化为灰度图像,滑动读取图像的窗口,截取预设范围的 所述图像直到所述图像被完全截取,...
【专利技术属性】
技术研发人员:李德斌,王巨宏,许勇,全琦,黄志斌,杨大威,谭志鹏,吴现,杨言,
申请(专利权)人:清华大学,腾讯科技深圳有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。