一种文字识别方法及系统技术方案

技术编号：32349079 阅读：48 留言：0更新日期：2022-02-20 02:12

本发明专利技术适用于图像识别技术领域，尤其涉及一种文字识别方法及系统，所述方法包括：采集待识别图像，并对待识别图像进行预处理，得到增强图像；上传增强图像，对增强图像中的文字区域进行提取，得到文字区域图像；对文字区域图像进行背景处理，得到无背景文字图像；清理无背景文字图像的线段和点，并利用卷积神经网络进行识别，得到文字识别结果。本发明专利技术通过对图像进行预处理，并对其进行增强处理，使其包含的文字内容更加清洗，进而在去除背景后，利用卷积神经网络进行识别，得到文字识别结果，识别精度高，不仅能够识别印刷体，还能够对非印刷体进行精准识别。印刷体进行精准识别。印刷体进行精准识别。

全部详细技术资料下载

【技术实现步骤摘要】
一种文字识别方法及系统

[0001]本专利技术属于图像识别
，尤其涉及一种文字识别方法及系统。

技术介绍

[0002]利用计算机自动识别字符的技术，是模式识别应用的一个重要领域。人们在生产和生活中，要处理大量的文字、报表和文本。为了减轻人们的劳动，提高处理效率，人们开始探讨一般文字识别方法，并研制出光学字符识别器。
[0003]随着科技的发展与进步，文字识别技术已经被广泛应用，例如有的软件通过对截图进行处理，就可以识别图片中包含的文字内容，特别是对于印刷体的文字，识别结果非常准确。
[0004]但是，对于非印刷体的文字，上述识别方式难以取得令人满意的识别精度，因此亟需一种针对非印刷体的文字识别方法，以解决上述问题。

技术实现思路

[0005]本专利技术实施例的目的在于提供一种文字识别方法，旨在解决
技术介绍
第三部分中提出的问题。
[0006]本专利技术实施例是这样实现的，一种文字识别方法，所述方法包括：采集待识别图像，并对待识别图像进行预处理，得到增强图像；上传增强图像，对增强图像...

【技术保护点】

【技术特征摘要】
1.一种文字识别方法，其特征在于，所述方法包括：采集待识别图像，并对待识别图像进行预处理，得到增强图像；上传增强图像，对增强图像中的文字区域进行提取，得到文字区域图像；对文字区域图像进行背景处理，得到无背景文字图像；清理无背景文字图像的线段和点，并利用卷积神经网络进行识别，得到文字识别结果。2.根据权利要求1所述的文字识别方法，其特征在于，所述上传增强图像，对增强图像中的文字区域进行提取，得到文字区域图像的步骤，具体包括：对人工神经网络进行训练，利用训练后的人工神经网络对增强图像进行目标识别，并提取目标区域图像；对目标区域图像进行裁剪，得到文字区域图像。3.根据权利要求1所述的文字识别方法，其特征在于，所述对文字区域图像进行背景处理，得到无背景文字图像的步骤，具体包括：通过自动化阈值和分割区域处理的方式对字体图片进行二值化处理，并以二值化结果为掩码，去除背景，得到无背景文字图像。4.根据权利要求1所述的文字识别方法，其特征在于，所述清理无背景文字图像的线段和点...

【专利技术属性】
技术研发人员：许占林，张宏杰，张健，刘树，
申请(专利权)人：北京许先网科技发展有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人