文字识别的方法、装置、设备及存储介质制造方法及图纸

技术编号：24997273 阅读：46 留言：0更新日期：2020-07-24 17:59

本发明专利技术涉及图像处理领域，公开了一种文字识别的方法、装置、设备及存储介质，用于解决在自然场景下识别字符时，文字识别的效率以及准确率低下的问题。文字识别的方法包括：获取基础样本图片，并对基础样本图片进行预处理，得到目标处理图片；采用预置检测算法切分目标处理图片，得到多个标记子图；利用深度学习算法排除多个标记子图中的目标类字符图案，得到多个目标子图；基于相似度算法计算多个目标子图中任意两个目标子图之间的相关度，得到多个相关度矩阵；通过聚类算法对多个相关度矩阵进行分类，得到多组分类矩阵，并根据多组分类矩阵对多个目标子图进行分类；对分类后的多个目标子图进行字符识别，得到字符识别结果。

全部详细技术资料下载

【技术实现步骤摘要】
文字识别的方法、装置、设备及存储介质
本专利技术涉及图像处理领域，尤其涉及一种文字识别的方法、装置、设备及存储介质。
技术介绍
随着计算机的不断更迭，各行各业中均利用计算机技术完成各项目标任务，其中智能识别领域中的文字识别就是通过计算机技术完成的。一般的文字识别系统常常用于识别使用光学设备扫描生成的文档，比如数字化古籍，识别名片、发票、表单等。通常这类扫描文档有着比较高的分辨率和对比度，而且打印字体一般都比较单一规整，多用于识别的单个文字。在现有的技术中，识别自然场景下的文字仍然存在干扰问题，当字符与类字符图案同时存在同一个背景中时，利用传统的文字识别技术识别到的字符易产生乱序，难以区分字符与近似字符图案，文字识别的效率以及准确率低下。
技术实现思路
本专利技术的主要目的在于解决在自然场景下识别字符时，文字识别的效率以及准确率低下的问题。本专利技术第一方面提供了一种文字识别的方法，包括：获取基础样本图片，并对所述基础样本图片进行预处理，得到目标处理图片，所述基础样本图片用于显示基础字符以及...

【技术保护点】
1.一种文字识别的方法，其特征在于，所述文字识别的方法包括：/n获取基础样本图片，并对所述基础样本图片进行预处理，得到目标处理图片，所述基础样本图片用于显示基础字符以及基础类字符图案，所述基础类字符图案用于指示与所述基础字符形状相似的图案；/n采用预置检测算法切分所述目标处理图片，得到多个标记子图，所述多个标记子图包括目标字符以及目标类字符图案；/n利用深度学习算法排除所述多个标记子图中的所述目标类字符图案，得到多个目标子图，所述多个目标子图中只包含所述目标字符；/n基于相似度算法计算所述多个目标子图中任意两个目标子图之间的相关度，得到多个相关度矩阵；/n通过聚类算法对所述多个相关度矩阵进行分...

【技术特征摘要】
1.一种文字识别的方法，其特征在于，所述文字识别的方法包括：
获取基础样本图片，并对所述基础样本图片进行预处理，得到目标处理图片，所述基础样本图片用于显示基础字符以及基础类字符图案，所述基础类字符图案用于指示与所述基础字符形状相似的图案；
采用预置检测算法切分所述目标处理图片，得到多个标记子图，所述多个标记子图包括目标字符以及目标类字符图案；
利用深度学习算法排除所述多个标记子图中的所述目标类字符图案，得到多个目标子图，所述多个目标子图中只包含所述目标字符；
基于相似度算法计算所述多个目标子图中任意两个目标子图之间的相关度，得到多个相关度矩阵；
通过聚类算法对所述多个相关度矩阵进行分类，得到多组分类矩阵，并根据所述多组分类矩阵对所述多个目标子图进行分类；
对分类后的多个目标子图进行字符识别，得到字符识别结果。

2.根据权利要求1所述的文字识别的方法，其特征在于，所述获取基础样本图片，并对所述基础样本图片进行预处理，得到目标处理图片，所述基础样本图片用于显示基础字符以及基础类字符图案，所述基础类字符图案用于指示与所述基础字符形状相似的图案包括：
获取基础样本图片，所述基础样本图片用于显示基础字符以及基础类字符图案，所述基础类字符图案用于指示与所述基础字符形状相似的图案；
利用预置腐蚀公式处理所述基础样本图片，得到第一处理图片，所述预置腐蚀公式为：E1为第一处理图片的结构元素，F为基础样本图片原图，S为基础样本图片中的结构元素，X为基础样本图片中的连通域，(x,y)为S原点的移动坐标；
利用预置膨胀公式处理所述第一处理图片，得到目标处理图片，所述预置膨胀公式为：E2为目标处理图片的结构元素，F'为第一处理图片原图，S'为第一处理图片中的结构元素。

3.根据权利要求1所述的文字识别的方法，其特征在于，所述采用预置检测算法切分所述目标处理图片，得到多个标记子图，所述多个标记子图包括目标字符以及目标类字符图案包括：
采用预置检测算法对所述目标处理图片进行灰度化处理，得到灰度图；
遍历所述灰度图，并对所述灰度图进行二值化，得到第二处理图片；
在所述第二处理图片中获取基础字符的轮廓以及基础类字符图案的轮廓，并在所述基础字符的轮廓外以及所述基础类字符图案外设置边框矩形；
截取所述第二处理图片中的所述边框矩形，得到多个标记子图，所述标记子图包括目标字符以及目标类字符图案。

4.根据权利要求1所述的文字识别的方法，其特征在于，所述利用深度学习算法排除所述多个标记子图中的所述目标类字符图案，得到多个目标子图，所述多个目标子图中只包括所述目标字符包括：
针对所述多个标记子图中的每一个标记子图，在每一个标记子图中提取特征点，并计算所有特征点的卷积，得到目标特征图；
在所述目标特征图中预测候选区域，所述候选区域内包括所述目标类字符图案或所述目标字符；
池化所述候选区域，并对每个候选区域内的特征点进行二分类，得到多个携带有目标类字符图案的标记子图以及多个携带有目标字符的目标子图；
剔除所述多个携带有目标类字符图案的基础标记子图，得到多个目标子图，所述多个目标子图中只包括所述目标字符。

5.根据权利要求1所述的...

【专利技术属性】
技术研发人员：衡鹤瑞，李培吉，李斯，
申请(专利权)人：上海东普信息科技有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人