OCR训练样本生成方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:35460467 阅读:42 留言:0更新日期:2022-11-03 12:27
本发明专利技术涉及计算机视觉技术领域,提供了一种OCR训练样本生成方法、装置、计算机设备和存储介质,所述方法包括:读取背景图片中各像素点的颜色,得到背景图片像素颜色列表,以及构建目标场景的候选文本颜色列表;对于所述候选文本颜色列表和所述背景图片像素颜色列表,分别基于颜色列表中各颜色计算对应的亮度值,得到候选文本颜色亮度值列表和背景图片像素亮度值列表;分别计算所述候选文本颜色亮度值列表中各亮度值与所述背景图片像素亮度列表中各亮度值的亮度比,根据所述亮度比筛选可辨识文本颜色;利用所述可辨识文本颜色和所述背景图片生成所述目标场景的OCR训练样本。采用本方法能够得到各场景下高质量的OCR训练样本。方法能够得到各场景下高质量的OCR训练样本。方法能够得到各场景下高质量的OCR训练样本。

【技术实现步骤摘要】
OCR训练样本生成方法、装置、计算机设备和存储介质


[0001]本专利技术属于计算机视觉
,尤其涉及一种OCR训练样本生成方法、装置、计算机设备和存储介质。

技术介绍

[0002]OCR(optical character recognition,光学字符识别)是计算机视觉研究领域的分之之一,其本质是图像识别。现阶段,在PDF图片、截图等简单环境下的OCR识别准确度比较高。但是在实际社会生产生活中,复杂场景下的OCR识别同样有着广泛的应用需求,比如街景文本、广告文本、电影字幕等领域。
[0003]然而,由于在实际应用中因样本收集困难,自然场景背景千变万化,文本颜色和背景色过于接近且不可辨识,导致训练文本识别模型缺少足够多的高质量训练样本,从而影响了OCR向更深层次、更广泛的领域发展。现有大多通过人工生成数据的方式来生成样本,然而人工生成因背景复杂容易导致文本可辨识度低,使得样本质量仍较差,同样影响了OCR的准确度。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够快速得到高质量样本的OCR训练本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种OCR训练样本生成方法,其特征在于,包括:读取背景图片中各像素点的颜色,得到背景图片像素颜色列表,以及构建目标场景的候选文本颜色列表;对于所述候选文本颜色列表和所述背景图片像素颜色列表,分别基于颜色列表中各颜色计算对应的亮度值,得到候选文本颜色亮度值列表和背景图片像素亮度值列表;分别计算所述候选文本颜色亮度值列表中各亮度值与所述背景图片像素亮度列表中各亮度值的亮度比,根据所述亮度比筛选可辨识文本颜色;利用所述可辨识文本颜色和所述背景图片生成所述目标场景的OCR训练样本。2.根据权利要求1所述的方法,其特征在于,基于颜色列表中各颜色计算对应的亮度值,得到亮度值列表,包括:对颜色列表中各颜色分别进行归一化,得到归一化颜色列表;基于所述归一化颜色列表中各颜色的色域值计算线性色域值,得到线性颜色列表;分别计算所述线性颜色列表中各颜色的亮度值,得到亮度值列表。3.根据权利要求2所述的方法,其特征在于,所述基于所述归一化颜色列表中各颜色的色域值计算线性色域值,得到线性颜色列表,包括:将所述归一化颜色列表中各颜色的色域值与色域阈值进行比对;当所述色域值小于所述色域阈值时,将所述色域值与第一预设值的比值作为线性色域值;当所述色域值大于等于所述色域阈值时,确定所述色域值和第二预设值相加后与第三预设值的比值,计算所述比值的预设次方作为线性色域值。4.根据权利要求1所述的方法,其特征在于,所述分别计算所述候选文本颜色亮度值列表中各亮度值与所述背景图片像素亮度列表中各亮度值的亮度比,根据所述亮度比筛选可辨识文本颜色,包括:分别计算所述候选文本颜色亮度值列表中各亮度值与所述背景图片像素亮度列表中各亮度值的亮度比,根据各所述亮度比构成亮度比矩阵;基于预设亮度比阈值与各所述亮度比的大小关系,构建与所述亮度比矩阵同型的辨识矩阵;根据所述辨识矩阵中各元素的分布,确定可辨识文本颜色。5.根据权利要求4所述的方法,其特征在于,所述基于预设亮度比阈值与各所述亮度比的大小关系,构建与所述亮度比矩阵同型的辨识矩阵,包括:构建与所述亮度比矩阵同型的辨识空矩阵,并获取第...

【专利技术属性】
技术研发人员:索红亮郭建京周忠诚黄九鸣张圣栋
申请(专利权)人:湖南星汉数智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1