一种文字识别方法及系统技术方案

技术编号:32349079 阅读:48 留言:0更新日期:2022-02-20 02:12
本发明专利技术适用于图像识别技术领域,尤其涉及一种文字识别方法及系统,所述方法包括:采集待识别图像,并对待识别图像进行预处理,得到增强图像;上传增强图像,对增强图像中的文字区域进行提取,得到文字区域图像;对文字区域图像进行背景处理,得到无背景文字图像;清理无背景文字图像的线段和点,并利用卷积神经网络进行识别,得到文字识别结果。本发明专利技术通过对图像进行预处理,并对其进行增强处理,使其包含的文字内容更加清洗,进而在去除背景后,利用卷积神经网络进行识别,得到文字识别结果,识别精度高,不仅能够识别印刷体,还能够对非印刷体进行精准识别。印刷体进行精准识别。印刷体进行精准识别。

【技术实现步骤摘要】
一种文字识别方法及系统


[0001]本专利技术属于图像识别
,尤其涉及一种文字识别方法及系统。

技术介绍

[0002]利用计算机自动识别字符的技术,是模式识别应用的一个重要领域。人们在生产和生活中,要处理大量的文字、报表和文本。为了减轻人们的劳动,提高处理效率,人们开始探讨一般文字识别方法,并研制出光学字符识别器。
[0003]随着科技的发展与进步,文字识别技术已经被广泛应用,例如有的软件通过对截图进行处理,就可以识别图片中包含的文字内容,特别是对于印刷体的文字,识别结果非常准确。
[0004]但是,对于非印刷体的文字,上述识别方式难以取得令人满意的识别精度,因此亟需一种针对非印刷体的文字识别方法,以解决上述问题。

技术实现思路

[0005]本专利技术实施例的目的在于提供一种文字识别方法,旨在解决
技术介绍
第三部分中提出的问题。
[0006]本专利技术实施例是这样实现的,一种文字识别方法,所述方法包括:采集待识别图像,并对待识别图像进行预处理,得到增强图像;上传增强图像,对增强图像中的文字区域进行提取本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文字识别方法,其特征在于,所述方法包括:采集待识别图像,并对待识别图像进行预处理,得到增强图像;上传增强图像,对增强图像中的文字区域进行提取,得到文字区域图像;对文字区域图像进行背景处理,得到无背景文字图像;清理无背景文字图像的线段和点,并利用卷积神经网络进行识别,得到文字识别结果。2.根据权利要求1所述的文字识别方法,其特征在于,所述上传增强图像,对增强图像中的文字区域进行提取,得到文字区域图像的步骤,具体包括:对人工神经网络进行训练,利用训练后的人工神经网络对增强图像进行目标识别,并提取目标区域图像;对目标区域图像进行裁剪,得到文字区域图像。3.根据权利要求1所述的文字识别方法,其特征在于,所述对文字区域图像进行背景处理,得到无背景文字图像的步骤,具体包括:通过自动化阈值和分割区域处理的方式对字体图片进行二值化处理,并以二值化结果为掩码,去除背景,得到无背景文字图像。4.根据权利要求1所述的文字识别方法,其特征在于,所述清理无背景文字图像的线段和点...

【专利技术属性】
技术研发人员:许占林张宏杰张健刘树
申请(专利权)人:北京许先网科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1