OCR姓名识别检测方法技术

技术编号:41564553 阅读:33 留言:0更新日期:2024-06-06 23:47
本发明专利技术公开了一种OCR姓名识别检测方法,包括以下步骤:步骤(A):通过OCR图像文字识别模型,对带有姓名和相关信息的图像进行文字识别,得到被识别内容;步骤(B):将所述被识别内容包含的被识别文字和识别准确率进行判断;步骤(C):通过坐标间距阈值判定后,将同一行文字进行提取;步骤(D):将图像的每行文字,按照各个姓名和对应的各个相关信息进行提取,计算每行被识别文字与姓名、相关信息的相似性,进行针对已知姓名的识别与纠错;步骤(E):根据姓名误识别库,进行针对未知姓名的识别与纠错;步骤(F):输出被识别的姓名和相关信息,以供输送并展示给用户。

【技术实现步骤摘要】

本专利技术涉及检测识别,尤其涉及一种ocr姓名识别检测方法。


技术介绍

1、现有技术的ocr识别方法包括如下两种:如,申请号为cn202310048317.1的一种医学ocr识别纠错方法的专利技术专利,只能在对医疗相关图像进行ocr识别并进行分词纠错,该方法无法直接应用于姓名识别检测;申请号为cn202111202786.1的一种ocr识别纠错装置和方法的专利技术专利,缺陷是利用bert和lstm深度学习模型进行通用性ocr识别检测,通常深度学习需要数量庞大的通用数据集进行训练,针对特定领域的识别检测并不合适。


技术实现思路

1、本专利技术的一个目的在于提供一种ocr姓名识别检测方法,能够直接应用于边检等各类工作场所的相关图像,对各类图像的组合式信息进行识别和检测,从而提供给用户供后续使用。

2、本专利技术的其它优势和特点通过下述的详细说明得以充分体现并可通过所附权利要求中特地指出的手段和装置的组合得以实现。

3、依本专利技术的一个方面,能够实现前述目的和其他目的和优势的本专利技术的一本文档来自技高网...

【技术保护点】

1.一种OCR姓名识别检测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的OCR姓名识别检测方法,其特征在于,所述步骤(A)包括子步骤(A1):所述被识别内容包括被识别文字、被识别文字的坐标、所述OCR图像文字识别模型生成的识别准确率。

3.根据权利要求2所述的OCR姓名识别检测方法,其特征在于,所述步骤(B)包括子步骤(B1):预设一个姓名误识别库,将现有的中国姓名库中已知姓名进行OCR识别,统计常规误识别字段,将常规误识别字段和对应正确文字进行映射,存储生成所述姓名误识别库。

4.根据权利要求3所述的OCR姓名识别检测方法,其特征在于,所...

【技术特征摘要】

1.一种ocr姓名识别检测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的ocr姓名识别检测方法,其特征在于,所述步骤(a)包括子步骤(a1):所述被识别内容包括被识别文字、被识别文字的坐标、所述ocr图像文字识别模型生成的识别准确率。

3.根据权利要求2所述的ocr姓名识别检测方法,其特征在于,所述步骤(b)包括子步骤(b1):预设一个姓名误识别库,将现有的中国姓名库中已知姓名进行ocr识别,统计常规误识别字段,将常规误识别字段和对应正确文字进行映射,存储生成所述姓名误识别库。

4.根据权利要求3所述的ocr姓名识别检测方法,其特征在于,所述步骤(d)包括子步骤(d1):相似性计算公式如下:

5.根据权利要求4所述的ocr姓名识别检测方法,其特征在于,所述步骤(c)包括子步骤(c1):计算相邻被识别文字a、b的坐标y1和y2间距的坐标间距阈值[dmin,dmax],其中,被识别文字a的坐标为y1,被识别文字b的坐标为y2,当坐标间距大于dmax时,能够确定相邻文字已换行,在后续识别过程中被认为换行文字,当坐标间距小于dmin时,或坐标间距在阈值[dmin,dmax]范围内时,均确定为同一行文字,公式如下:

6.根据权利要求5所述的ocr姓名识别检测...

【专利技术属性】
技术研发人员:王驰苗应亮胡长柏李胜南胡刚
申请(专利权)人:盛视科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1