提高OCR识别率的方法和系统技术方案

技术编号:26924541 阅读:23 留言:0更新日期:2021-01-01 22:50
本发明专利技术提供了一种提高OCR识别率的方法和系统,其中,所述方法包括以下步骤:获取待识别物体的图像,其中待识别物体设有位置识别点;对待识别物体的图像进行处理以标出位置识别点所在区域和待识别物体中的目标区域;对标出的目标区域的图像进行处理;对目标区域图像和处理后的目标区域图像进行OCR识别,以得到目标区域的识别字符;比对目标区域的识别字符和目标区域的实际字符;若目标区域的识别字符和目标区域的实际字符匹配,则计算位置识别点所在区域和目标区域之间的偏移量;根据位置识别点和偏移量对同一类型的待识别物体进行OCR识别。本发明专利技术能够通过待识别物体上的位置识别点来准确截取待识别物体的目标区域,从而能够提升OCR的识别率和准确度。

【技术实现步骤摘要】
提高OCR识别率的方法和系统
本专利技术涉及OCR识别
,具体涉及一种提高OCR识别率的方法和一种提高OCR识别率的系统。
技术介绍
在产线上对芯片上的字符进行OCR时,一般是将装有多块芯片的滑动设备经过相机镜头,以对芯片进行拍摄识别。但是,在通过光电信号硬触发相机对各个芯片进行依次拍照时,由于滑动设备速度较快,相机响应硬触发拍照会出现延迟,使得拍到芯片照片会出现轻微偏移,从而容易导致ROI截取的部分可能会导致出现干扰字符或者丢失部分目标字符,造成字符识别的准确度下降。
技术实现思路
本专利技术旨在至少在一定程度上解决上述技术中的技术问题之一。为此,本专利技术的一个目的在于提出一种提高OCR识别率的方法,能够通过待识别物体上的位置识别点来准确截取待识别物体的目标区域,从而能够提升OCR的识别率和准确度。本专利技术的第二个目的在于提出一种提高OCR识别率的系统。为达到上述目的,本专利技术第一方面实施例提出了一种提高OCR识别率的方法,包括以下步骤:获取待识别物体的图像,其中,所述待识别物体设有位置识别点;对所述待识别物体的图像进行处理以标出所述位置识别点所在区域和所述待识别物体中的目标区域;对标出的所述目标区域的图像进行处理;对所述目标区域图像和处理后的所述目标区域图像进行OCR识别,以得到所述目标区域的识别字符;比对所述目标区域的识别字符和所述目标区域的实际字符;若所述目标区域的识别字符和所述目标区域的实际字符匹配,则计算所述位置识别点所在区域和所述目标区域之间的偏移量;根据所述位置识别点和所述偏移量对同一类型的所述待识别物体进行OCR识别。根据本专利技术实施例提出的提高OCR识别率的方法,通过获取待识别物体的图像,并对待识别物体的图像进行处理以标出位置识别点所在区域和待识别物体中的目标区域,以及对标出的目标区域的图像进行处理,然后对目标区域图像和处理后的目标区域图像进行OCR识别,以得到目标区域的识别字符,并比对目标区域的识别字符和目标区域的实际字符,其中,若目标区域的识别字符和目标区域的实际字符匹配,则计算位置识别点所在区域和目标区域之间的偏移量,最后根据位置识别点和偏移量对同一类型的待识别物体进行OCR识别,由此,能够通过待识别物体上的位置识别点来准确截取待识别物体的目标区域,从而能够提升OCR的识别率和准确度。另外,根据本专利技术上述实施例提出的提高OCR识别率的方法还可以具有如下附加的技术特征:根据本专利技术的一个实施例,所述待识别物体采用固定模块印刻。根据本专利技术的一个实施例,对所述待识别物体的图像进行处理以标出所述位置识别点所在区域和所述待识别物体中的目标区域,包括以下步骤:采用ROI标出所述位置识别点所在区域,并获取所述位置识别点所在区域的标定坐标;采用ROI标出所述待识别物体中的目标区域,并获取所述目标区域的标定坐标和尺寸数据。根据本专利技术的一个实施例,对标出的所述目标区域的图像进行处理,包括以下步骤:设定多个旋转角度;根据多个所述旋转角度分别对标出的所述目标区域的图像进行旋转处理,并对应得到多个旋转图像。根据本专利技术的一个实施例,采用深度学习算法分别对标出的所述目标区域的图像和多个所述旋转图像进行OCR识别,并对应得到多组所述目标区域的识别字符。根据本专利技术的一个实施例,比对所述目标区域的识别字符和所述目标区域的实际字符,包括以下步骤:设定匹配阈值;比对每组所述目标区域的识别字符与所述目标区域的实际字符之间的匹配度;若存在至少一组所述目标区域的识别字符与所述目标区域的实际字符之间的匹配度达到所述匹配阈值,则选取其中匹配度最大的所述目标区域的识别字符对应的图像作为参考图像,并记录所述参考图像的旋转角度。根据本专利技术的一个实施例,根据所述位置识别点所在区域的标定坐标和所述目标区域的标定坐标计算所述位置识别点所在区域和所述目标区域之间的偏移量。根据本专利技术的一个实施例,根据所述位置识别点和所述偏移量对同一类型的所述待识别物体进行OCR识别,包括以下步骤:获取同一类型的所述待识别物体的检测图像;根据所述参考图像的旋转角度对所述检测图像进行旋转处理;对处理后的所述检测图像进行识别;若识别到所述检测图像的位置识别点,则获取所述检测图像的位置识别点所在区域的标定坐标;根据所述检测图像的位置识别点所在区域的标定坐标和所述偏移量得到所述检测图像的目标区域的标定坐标;根据所述检测图像的目标区域的标定坐标和所述尺寸数据对所述检测图像的目标区域的图像进行截取;采用所述深度学习算法对截取的所述检测图像的目标区域图像进行OCR识别。为达到上述目的,本专利技术第二方面实施例提出了一种提高OCR识别率的系统,包括:获取模块,所述获取模块用于获取待识别物体的图像,其中,所述待识别物体设有位置识别点;第一处理模块,所述第一处理模块用于对所述待识别物体的图像进行处理以标出所述位置识别点所在区域和所述待识别物体中的目标区域;第二处理模块,所述第二处理模块用于对标出的所述目标区域的图像进行处理;第一识别模块,所述第一识别模块用于对所述目标区域图像和处理后的所述目标区域图像进行OCR识别,以得到所述目标区域的识别字符;比对模块,所述比对模块用于比对所述目标区域的识别字符和所述目标区域的实际字符;计算模块,若所述目标区域的识别字符和所述目标区域的实际字符匹配,则通过所述计算模块计算所述位置识别点所在区域和所述目标区域之间的偏移量;第二识别模块,所述第二识别模块用于根据所述位置识别点和所述偏移量对同一类型的所述待识别物体进行OCR识别。根据本专利技术实施例提出的提高OCR识别率的系统,通过设置获取模块、第一处理模块、第二处理模块、第一识别模块、比对模块、计算模块和第二识别模块,其中,获取模块用于获取待识别物体的图像,第一处理模块用于对待识别物体的图像进行处理以标出位置识别点所在区域和待识别物体中的目标区域,第二处理模块用于对标出的目标区域的图像进行处理,第一识别模块用于对目标区域图像和处理后的目标区域图像进行OCR识别,以得到目标区域的识别字符,比对模块用于比对目标区域的识别字符和目标区域的实际字符,若目标区域的识别字符和目标区域的实际字符匹配,则通过计算模块计算位置识别点所在区域和目标区域之间的偏移量,第二识别模块用于根据位置识别点和偏移量对同一类型的待识别物体进行OCR识别,由此,能够通过待识别物体上的位置识别点来准确截取待识别物体的目标区域,从而能够提升OCR的识别率和准确度。另外,根据本专利技术上述实施例提出的提高OCR识别率的系统还可以具有如下附加的技术特征:根据本专利技术的一个实施例,所述待识别物体采用固定模块印刻。附图说明图1为本专利技术实施例的提高OCR识别率的方法的流程图;图2为本专利技术一个具体实施例的芯片mark点区域和目标区域的示意图;图3为本专利技术实施例的提高OCR识别率的系统的方框示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实本文档来自技高网...

【技术保护点】
1.一种提高OCR识别率的方法,其特征在于,包括以下步骤:/n获取待识别物体的图像,其中,所述待识别物体设有位置识别点;/n对所述待识别物体的图像进行处理以标出所述位置识别点所在区域和所述待识别物体中的目标区域;/n对标出的所述目标区域的图像进行处理;/n对所述目标区域图像和处理后的所述目标区域图像进行OCR识别,以得到所述目标区域的识别字符;/n比对所述目标区域的识别字符和所述目标区域的实际字符;/n若所述目标区域的识别字符和所述目标区域的实际字符匹配,则计算所述位置识别点所在区域和所述目标区域之间的偏移量;/n根据所述位置识别点和所述偏移量对同一类型的所述待识别物体进行OCR识别。/n

【技术特征摘要】
1.一种提高OCR识别率的方法,其特征在于,包括以下步骤:
获取待识别物体的图像,其中,所述待识别物体设有位置识别点;
对所述待识别物体的图像进行处理以标出所述位置识别点所在区域和所述待识别物体中的目标区域;
对标出的所述目标区域的图像进行处理;
对所述目标区域图像和处理后的所述目标区域图像进行OCR识别,以得到所述目标区域的识别字符;
比对所述目标区域的识别字符和所述目标区域的实际字符;
若所述目标区域的识别字符和所述目标区域的实际字符匹配,则计算所述位置识别点所在区域和所述目标区域之间的偏移量;
根据所述位置识别点和所述偏移量对同一类型的所述待识别物体进行OCR识别。


2.根据权利要求1所述的提高OCR识别率的方法,其特征在于,所述待识别物体采用固定模块印刻。


3.根据权利要求2所述的提高OCR识别率的方法,其特征在于,对所述待识别物体的图像进行处理以标出所述位置识别点所在区域和所述待识别物体中的目标区域,包括以下步骤:
采用ROI标出所述位置识别点所在区域,并获取所述位置识别点所在区域的标定坐标;
采用ROI标出所述待识别物体中的目标区域,并获取所述目标区域的标定坐标和尺寸数据。


4.根据权利要求3所述的提高OCR识别率的方法,其特征在于,对标出的所述目标区域的图像进行处理,包括以下步骤:
设定多个旋转角度;
根据多个所述旋转角度分别对标出的所述目标区域的图像进行旋转处理,并对应得到多个旋转图像。


5.根据权利要求4所述的提高OCR识别率的方法,其特征在于,其中,采用深度学习算法分别对标出的所述目标区域的图像和多个所述旋转图像进行OCR识别,并对应得到多组所述目标区域的识别字符。


6.根据权利要求5所述的提高OCR识别率的方法,其特征在于,比对所述目标区域的识别字符和所述目标区域的实际字符,包括以下步骤:
设定匹配阈值;
比对每组所述目标区域的识别字符与所述目标区域的实际字符之间的匹配度;
若存在至少一组所述目标区域的识别字符与所述目标区域的实际字符之间的匹配度达到所述匹配阈值,则选取其中匹配度最大的所述...

【专利技术属性】
技术研发人员:陈海波于强
申请(专利权)人:深兰人工智能芯片研究院江苏有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1