基于机器学习的OCR识别方法及系统技术方案

技术编号:42618922 阅读:43 留言:0更新日期:2024-09-03 18:25
本申请实施例提供一种基于机器学习的OCR识别方法及系统,通过综合考虑当前目标扫描图像块的关键业务特征、空间梯度信息以及过往扫描图像块中的业务特征变化规律,利用目标OCR业务屏蔽识别网络生成目标业务屏蔽窗口,从而实现对业务干扰内容的有效屏蔽,不仅提高了OCR识别的准确率,还具有较强的适应性和扩展性,可以广泛应用于各种OCR场景中。

【技术实现步骤摘要】

本专利技术涉及机器学习,具体而言,涉及一种基于机器学习的ocr识别方法及系统。


技术介绍

1、在信息技术和图像处理领域,ocr(optical character recognition,光学字符识别)技术一直是研究的热点和难点。传统的ocr技术主要基于模板匹配方法,通过比较图像中的字符与预定义的字符模板进行匹配,从而实现文字识别。然而,由于字体、尺寸、角度、光照等多种因素的影响,传统ocr技术的识别准确率存在一定的局限性。

2、随着计算机视觉技术的飞速发展,基于特征提取和模式识别的ocr方法逐渐成为主流,这类方法通过数字图像处理技术,提取字符的特征信息(如轮廓、角点等)来进行字符识别。尽管这种方法在一定程度上提高了识别准确率,但在处理复杂背景或变形字符时,仍存在一定的挑战。

3、近年来,随着深度学习技术的兴起,ocr技术迎来了新的发展机遇。深度学习模型,特别是卷积神经网络(cnn)和循环神经网络(rnn),在图像识别和自然语言处理等领域展现出了强大的能力。通过将深度学习技术应用于ocr领域,可以实现对复杂背景和变形字符的更准确识别本文档来自技高网...

【技术保护点】

1.一种基于机器学习的OCR识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于机器学习的OCR识别方法,其特征在于,所述获取与待识别图像所对应的当前目标扫描图像块和X个过往扫描图像块,包括:

3.根据权利要求2所述的基于机器学习的OCR识别方法,其特征在于,所述K个图像数据区块包括图像数据区块x,x为不大于K的正整数;

4.根据权利要求1所述的基于机器学习的OCR识别方法,其特征在于,所述当前目标扫描图像块包含有T1个特征点,所述T1个特征点包括一个基准特征点以及与特征点属性关联的T2个特征点,所述方法还包括:>

5.根据权利...

【技术特征摘要】

1.一种基于机器学习的ocr识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于机器学习的ocr识别方法,其特征在于,所述获取与待识别图像所对应的当前目标扫描图像块和x个过往扫描图像块,包括:

3.根据权利要求2所述的基于机器学习的ocr识别方法,其特征在于,所述k个图像数据区块包括图像数据区块x,x为不大于k的正整数;

4.根据权利要求1所述的基于机器学习的ocr识别方法,其特征在于,所述当前目标扫描图像块包含有t1个特征点,所述t1个特征点包括一个基准特征点以及与特征点属性关联的t2个特征点,所述方法还包括:

5.根据权利要求4所述的基于机器学习的ocr识别方法,其特征在于,所述y个特征空间域包括特征空间域y,y为不大于y的正整数;

6.根据权利要求1所述的基于机器学习的ocr识别方法,其特征在于,所述依据所述y个关键业务特征节点向量,获取与所述当前目标扫描图像块所对应的z个单维度空间梯度和z个复合维度空间梯度,包括:

7.根据权利要求...

【专利技术属性】
技术研发人员:赵国庆李壮壮
申请(专利权)人:北京中关村科金技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1