一种适用于文字提取的数据增强方法技术

技术编号：37159254 阅读：15 留言：0更新日期：2023-04-06 22:23

本申请提供了一种适用于文字提取的数据增强方法，包括：采集印刷品图片，生成真实字符数据。随机选取多个基础字符组成字符字体库，设置所述基础字符的字体、字号。根据背景图片设置所述基础字符的起始位置，所述字符字体库中依次选取基础字符，根据所述基础字符的字号和所述背景图片的大小，设置所述背景图片相应的基础字符的数量。根据所述背景图片设置所述基础字符的颜色，所述基础字符与所述基础字符所在的背景图片的RGB均值的差值大于等于50；将所述基础字符贴附于所述背景图片上，生成字符图片。本申请通过灵活设置字符的字体、字号和颜色，提高数据模型的检测精度，提升模型对印刷品文字提取任务的效果。印刷品文字提取任务的效果。印刷品文字提取任务的效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种适用于文字提取的数据增强方法

[0001]本申请涉及印刷品文字提取
，尤其涉及一种适用于文字提取的数据增强方法。

技术介绍

[0002]在印刷领域，为了对印刷品质量进行检测，通常需要采用文字提取技术。印刷品的文字一键提取任务，是在印刷的包装中提取出文字，检测文字缺陷。
[0003]通过对印刷品表面的图案进行采集，提取图案内的文字，将提取到的采用数据模型对提取的文字进行检测，输出印刷品的文字的印刷质量。在利用数据模型进行检测前，需要将训练数据集输入数据模型，对数据模型进行训练。
[0004]印刷于包装表面的图案存在文字背景复杂、文字种类的数据不平衡、数据量不足的特性，在文字提取时导致背景复杂区域文字漏提、小号字体提取模糊、艺术字提取不到的问题，导致数据模型训练效果差。

技术实现思路

[0005]本申请提供了一种适用于文字提取的数据增强方法，以解决印刷品文字提取数据模型训练效果差的技术问题。
[0006]为解决以上问题，本申请提供了一种适用于文字提取的数据增强方法，包括：
[0007]采集印刷品图片，生成真实字符数据；
[0008]随机选取多个基础字符组成字符字体库，设置所述基础字符的字体、字号；
[0009]根据背景图片设置所述基础字符的起始位置，所述字符字体库中依次选取基础字符，根据所述基础字符的字号和所述背景图片的大小，设置所述背景图片相应的基础字符的数量；
[0010]根据所述背景图片设置所述基础字符的颜色，所述基础字符与所述基础字...

【技术保护点】

【技术特征摘要】
1.一种适用于文字提取的数据增强方法，其特征在于，包括：采集印刷品图片，生成真实字符数据；随机选取多个基础字符组成字符字体库，设置所述基础字符的字体、字号；根据背景图片设置所述基础字符的起始位置，所述字符字体库中依次选取基础字符，根据所述基础字符的字号和所述背景图片的大小，设置所述背景图片相应的基础字符的数量；根据所述背景图片设置所述基础字符的颜色，所述基础字符与所述基础字符所在的背景图片的RGB均值的差值大于等于50；将所述基础字符贴附于所述背景图片上，生成字符图片。2.根据权利要求1所述的适用于文字提取的数据增强方法，其特征在于，还包括：将所述字符图片中的基础字符所在区域背景设置为纯色。3.根据权利要求2所述的适用于文字提取的数据增强方法，其特征在于，还包括：根据背景图片尺寸生成标签矩阵，其中，字符所在区域设置值为1，其他区域设置值为0。4.根据权利要求1所述的适用于文字提取的数据增强方法，其特征在于，所述设置所述基础字符的字体、字号，包括：设置所述基础字符的字号在12
‑
20的数量占全部基础字符的40％；设置所述基础字符的字号在50
‑...

【专利技术属性】
技术研发人员：张昀珂，杨艺，
申请(专利权)人：凌云光技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人