OCR训练样本生成方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:35460467 阅读:18 留言:0更新日期:2022-11-03 12:27
本发明专利技术涉及计算机视觉技术领域,提供了一种OCR训练样本生成方法、装置、计算机设备和存储介质,所述方法包括:读取背景图片中各像素点的颜色,得到背景图片像素颜色列表,以及构建目标场景的候选文本颜色列表;对于所述候选文本颜色列表和所述背景图片像素颜色列表,分别基于颜色列表中各颜色计算对应的亮度值,得到候选文本颜色亮度值列表和背景图片像素亮度值列表;分别计算所述候选文本颜色亮度值列表中各亮度值与所述背景图片像素亮度列表中各亮度值的亮度比,根据所述亮度比筛选可辨识文本颜色;利用所述可辨识文本颜色和所述背景图片生成所述目标场景的OCR训练样本。采用本方法能够得到各场景下高质量的OCR训练样本。方法能够得到各场景下高质量的OCR训练样本。方法能够得到各场景下高质量的OCR训练样本。

【技术实现步骤摘要】
OCR训练样本生成方法、装置、计算机设备和存储介质


[0001]本专利技术属于计算机视觉
,尤其涉及一种OCR训练样本生成方法、装置、计算机设备和存储介质。

技术介绍

[0002]OCR(optical character recognition,光学字符识别)是计算机视觉研究领域的分之之一,其本质是图像识别。现阶段,在PDF图片、截图等简单环境下的OCR识别准确度比较高。但是在实际社会生产生活中,复杂场景下的OCR识别同样有着广泛的应用需求,比如街景文本、广告文本、电影字幕等领域。
[0003]然而,由于在实际应用中因样本收集困难,自然场景背景千变万化,文本颜色和背景色过于接近且不可辨识,导致训练文本识别模型缺少足够多的高质量训练样本,从而影响了OCR向更深层次、更广泛的领域发展。现有大多通过人工生成数据的方式来生成样本,然而人工生成因背景复杂容易导致文本可辨识度低,使得样本质量仍较差,同样影响了OCR的准确度。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够快速得到高质量样本的OCR训练样本生成方法、装置、计算机设备和存储介质。
[0005]本专利技术提供一种OCR训练样本生成方法,包括:
[0006]读取背景图片中各像素点的颜色,得到背景图片像素颜色列表,以及构建目标场景的候选文本颜色列表;
[0007]对于所述候选文本颜色列表和所述背景图片像素颜色列表,分别基于颜色列表中各颜色计算对应的亮度值,得到候选文本颜色亮度值列表和背景图片像素亮度值列表;
[0008]分别计算所述候选文本颜色亮度值列表中各亮度值与所述背景图片像素亮度列表中各亮度值的亮度比,根据所述亮度比筛选可辨识文本颜色;
[0009]利用所述可辨识文本颜色和所述背景图片生成所述目标场景的OCR训练样本。
[0010]在其中一个实施例中,
[0011]基于颜色列表中各颜色计算对应的亮度值,得到亮度值列表,包括:
[0012]对颜色列表中各颜色分别进行归一化,得到归一化颜色列表;
[0013]基于所述归一化颜色列表中各颜色的色域值计算线性色域值,得到线性颜色列表;
[0014]分别计算所述线性颜色列表中各颜色的亮度值,得到亮度值列表。
[0015]在其中一个实施例中,所述基于所述归一化颜色列表中各颜色的色域值计算线性色域值,得到线性颜色列表,包括:
[0016]将所述归一化颜色列表中各颜色的色域值与色域阈值进行比对;
[0017]当所述色域值小于所述色域阈值时,将所述色域值与第一预设值的比值作为线性
色域值;
[0018]当所述色域值大于等于所述色域阈值时,确定所述色域值和第二预设值相加后与第三预设值的比值,计算所述比值的预设次方作为线性色域值。
[0019]在其中一个实施例中,所述分别计算所述候选文本颜色亮度值列表中各亮度值与所述背景图片像素亮度列表中各亮度值的亮度比,根据所述亮度比筛选可辨识文本颜色,包括:
[0020]分别计算所述候选文本颜色亮度值列表中各亮度值与所述背景图片像素亮度列表中各亮度值的亮度比,根据各所述亮度比构成亮度比矩阵;
[0021]基于预设亮度比阈值与各所述亮度比的大小关系,构建与所述亮度比矩阵同型的辨识矩阵;
[0022]根据所述辨识矩阵中各元素的分布,确定可辨识文本颜色。
[0023]在其中一个实施例中,所述基于预设亮度比阈值与各所述亮度比的大小关系,构建与所述亮度比矩阵同型的辨识矩阵,包括:
[0024]构建与所述亮度比矩阵同型的辨识空矩阵,并获取第一亮度比阈值和第二亮度比阈值;
[0025]遍历所述亮度比矩阵中的各所述亮度比,当所述亮度比大于等于第一亮度比阈值或小于等于第二亮度比阈值时,在所述辨识空矩阵对应的位置写入可辨识标识,当所述亮度比小于第一亮度比阈值且大于第二亮度比阈值时,在所述辨识空矩阵对应的位置写入不可辨识标识,得到辨识矩阵。
[0026]在其中一个实施例中,所述根据所述辨识矩阵中各元素的分布,确定可辨识文本颜色,包括:
[0027]按列求和所述辨识矩阵,得到可辨识像素点数目列表;
[0028]从所述可辨识像素点数目列表中选取数目最大值对应的候选文本颜色作为可辨识文本颜色。
[0029]在其中一个实施例中,所述利用所述可辨识文本颜色和所述背景图片生成所述目标场景的OCR训练样本,包括:
[0030]利用所述可辨识文本颜色在透明背景中生成所述目标场景对应的文字内容,得到透明背景文字图片;
[0031]将所述透明背景文字图片粘贴到所述背景图片上,得到所述目标场景的OCR训练样本。
[0032]一种OCR训练样本生成装置,包括:
[0033]颜色列表获取模块,用于读取背景图片中各像素点的颜色,得到背景图片像素颜色列表,以及构建目标场景的候选文本颜色列表;
[0034]亮度值确定模块,用于对于所述候选文本颜色列表和所述背景图片像素颜色列表,分别基于颜色列表中各颜色计算对应的亮度值,得到候选文本颜色亮度值列表和背景图片像素亮度值列表;
[0035]筛选模块,用于分别计算所述候选文本颜色亮度值列表中各亮度值与所述背景图片像素亮度列表中各亮度值的亮度比,根据所述亮度比筛选可辨识文本颜色;
[0036]生成模块,用于利用所述可辨识文本颜色和所述背景图片生成所述目标场景的
OCR训练样本。
[0037]本专利技术还提供一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器存储由计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的OCR训练样本生成方法的步骤。
[0038]本专利技术还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的OCR训练样本生成方法的步骤。
[0039]上述OCR训练样本生成方法、装置、计算机设备和存储介质,通过读取背景图片中各像素点的颜色,得到背景图片像素颜色列表,以及构建目标场景的候选文本颜色列表之后,对于候选文本颜色列表和背景图片像素颜色列表这两个颜色列表,分别基于其中的颜色计算对应的亮度值,得到候选文本颜色亮度值列表和背景图片像素亮度值列表。然后,再分别计算候选文本颜色亮度值列表中各亮度值与背景图片像素亮度列表中各亮度值的亮度比,根据亮度比筛选可辨识文本颜色后,利用该可辨识文本颜色和背景图片生成目标场景的OCR训练样本,从而实现了基于任意背景都能够快速生成高质量的可辨识训练样本,避免自然场景下训练样本不足所导致的OCR准确率降低的问题。
附图说明
[0040]图1为一个实施例中OCR训练样本生成方法的应用环境图。
[0041]图2为一个实施例中OCR训练样本生成方法的流程示意图。
[0042]图3为一个实施例中OCR训练样本生成装置的结构框图。
具体实施方式
[0043]为了使本专利技术的目的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种OCR训练样本生成方法,其特征在于,包括:读取背景图片中各像素点的颜色,得到背景图片像素颜色列表,以及构建目标场景的候选文本颜色列表;对于所述候选文本颜色列表和所述背景图片像素颜色列表,分别基于颜色列表中各颜色计算对应的亮度值,得到候选文本颜色亮度值列表和背景图片像素亮度值列表;分别计算所述候选文本颜色亮度值列表中各亮度值与所述背景图片像素亮度列表中各亮度值的亮度比,根据所述亮度比筛选可辨识文本颜色;利用所述可辨识文本颜色和所述背景图片生成所述目标场景的OCR训练样本。2.根据权利要求1所述的方法,其特征在于,基于颜色列表中各颜色计算对应的亮度值,得到亮度值列表,包括:对颜色列表中各颜色分别进行归一化,得到归一化颜色列表;基于所述归一化颜色列表中各颜色的色域值计算线性色域值,得到线性颜色列表;分别计算所述线性颜色列表中各颜色的亮度值,得到亮度值列表。3.根据权利要求2所述的方法,其特征在于,所述基于所述归一化颜色列表中各颜色的色域值计算线性色域值,得到线性颜色列表,包括:将所述归一化颜色列表中各颜色的色域值与色域阈值进行比对;当所述色域值小于所述色域阈值时,将所述色域值与第一预设值的比值作为线性色域值;当所述色域值大于等于所述色域阈值时,确定所述色域值和第二预设值相加后与第三预设值的比值,计算所述比值的预设次方作为线性色域值。4.根据权利要求1所述的方法,其特征在于,所述分别计算所述候选文本颜色亮度值列表中各亮度值与所述背景图片像素亮度列表中各亮度值的亮度比,根据所述亮度比筛选可辨识文本颜色,包括:分别计算所述候选文本颜色亮度值列表中各亮度值与所述背景图片像素亮度列表中各亮度值的亮度比,根据各所述亮度比构成亮度比矩阵;基于预设亮度比阈值与各所述亮度比的大小关系,构建与所述亮度比矩阵同型的辨识矩阵;根据所述辨识矩阵中各元素的分布,确定可辨识文本颜色。5.根据权利要求4所述的方法,其特征在于,所述基于预设亮度比阈值与各所述亮度比的大小关系,构建与所述亮度比矩阵同型的辨识矩阵,包括:构建与所述亮度比矩阵同型的辨识空矩阵,并获取第...

【专利技术属性】
技术研发人员:索红亮郭建京周忠诚黄九鸣张圣栋
申请(专利权)人:湖南星汉数智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1