字符识别方法、装置、设备及计算机可读介质制造方法及图纸

技术编号：21433521 阅读：17 留言：0更新日期：2019-06-22 12:19

本申请涉及一种字符识别方法、装置、设备及计算机可读介质。所述方法包括：获取目标文件的扫描文件，并对所述扫描文件进行图像处理；利用光学字符识别OCR技术对图像处理得到的目标图像进行字符识别，得到第一识别文本；其中，在利用所述OCR技术进行字符识别时，使用R1_PCA对所述目标图像中的字符特征进行降维。本申请通过在OCR文字识别特征降维中运用R1_PCA降维技术，使用R1_PCA与OCR技术相融合，可以在文字特征中存在噪声时，使用此降维方法可以减少噪声的干扰，从而提升OCR技术的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
字符识别方法、装置、设备及计算机可读介质
本申请涉及计算机
，尤其涉及一种字符识别方法、装置、设备及计算机可读介质。
技术介绍
随着人工智能的热度上升，图像识别这一领域也渐渐被人们所关注。光学字符识别(OpticalCharacterRecognition，OCR)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程。然而，传统利用OCR技术对字符识别时所使用的降维方法如PCA，LDA等，都是以L2范数的平方作为损失函数的距离度量，当特征中存在噪声时，PCA，LDA不具有鲁棒性，因为目标函数为误差平方和(L2范数)使得这些算法对异常值具有放大作用，微小的异常数据都可能使得估计子空间偏差较大，无法反映真实的状况。对样本中的异常值(噪声)敏感。
技术实现思路
为了解决上述技术问题或者至少部分地解决上述技术问题，本申请提供了一种字符识别方法、装置、设备及计算机可读介质。第一方面，本申请提供了一种字符识别方法，包括：获取目标文件的扫描文件，并对所述扫描文件进行图像处理；利用光学字符识别OCR技术对图像处理得到的目标图像进行字符识别，得到第一识别文本；其中，在利用所述OCR技术进行字符识别时，使用R1_PCA对所述目标图像中的字符特征进行降维。可选地，所述R1_PCA以R1范数的一次方作为损失函数的距离度量：其中，X∈Rm×n表示文字特征提取矩阵，U∈Rm×d表示投影轴，V＝UTX表示降维后的文字特征矩阵。可选地，所述方法还包括：获取所述目标文件的PDF文件；识别所述PDF文件中的第...

【技术保护点】
1.一种字符识别方法，其特征在于，包括：获取目标文件的扫描文件，并对所述扫描文件进行图像处理；利用光学字符识别OCR技术对图像处理得到的目标图像进行字符识别，得到第一识别文本；其中，在利用所述OCR技术进行字符识别时，使用R1_PCA对所述目标图像中的字符特征进行降维。

【技术特征摘要】
1.一种字符识别方法，其特征在于，包括：获取目标文件的扫描文件，并对所述扫描文件进行图像处理；利用光学字符识别OCR技术对图像处理得到的目标图像进行字符识别，得到第一识别文本；其中，在利用所述OCR技术进行字符识别时，使用R1_PCA对所述目标图像中的字符特征进行降维。2.根据权利要求1所述的字符识别方法，其特征在于，所述R1_PCA以R1范数的一次方作为损失函数的距离度量：其中，X∈Rm×n表示文字特征提取矩阵，U∈Rm×d表示投影轴，V＝UTX表示降维后的文字特征矩阵。3.根据权利要求1所述的字符识别方法，其特征在于，所述方法还包括：获取所述目标文件的PDF文件；识别所述PDF文件中的第二识别文本；将所述第二识别文本与所述第一识别文本比较，确定所述第一识别文本与所述第二识别文本之间的差异字符。4.根据权利要求3所述的字符识别方法，其特征在于，所述方法还包括：在所述第一识别文本和所述第二识别文本中标注所述差异字符；和/或，利用所述第一识别文本中的差异字符替换所述第二识别文本中的差异字符；和/或，利用所述第二识别文本中的差异字符替换所述第一识别文本中的差异字符。5.一种字符识别装置，其特征在于，包括：第一获取模块，用于获取目标文件的扫描文件，并对所述扫描文件进行图像处理；第一识别模块，用于利用光学字符识别OCR技术对图像处理得到的目标图像进行字符识别，得到第一识别文本；其中，在利用所...

【专利技术属性】
技术研发人员：张晴晴，徐冉，段由，杨金富，罗磊，马光谦，汪洋，
申请(专利权)人：北京爱数智慧科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人