一种文本信息的处理方法、装置、设备及可读存储介质制造方法及图纸

技术编号：39239610 阅读：18 留言：0更新日期：2023-10-30 11:52

本发明专利技术涉及文本数据处理技术领域，公开了一种文本信息的处理方法、装置、设备及可读存储介质。其中，该方法包括：获取待处理文本图片对应的初始化图片以及待处理文本图片的标注文本框，该初始化图片为像素值为0的单通道图片，且初始化图片的尺寸信息与待处理文本图片的尺寸信息一致；基于标注文本框的属性信息，在初始化图片中生成对应于多个标注文本框的文本掩膜，确定文本掩膜对应的多个目标文本框；基于标注文本框与目标文本框的像素信息，剔除无效文本信息对应的无效文本框，得到待处理文本图片中的有效文本信息及其对应的有效文本框。通过实施本发明专利技术，实现了文本数据的有效处理，保证了文本框信息的准确性，便于文本检测模型的精准训练。检测模型的精准训练。检测模型的精准训练。

全部详细技术资料下载

【技术实现步骤摘要】
一种文本信息的处理方法、装置、设备及可读存储介质

[0001]本专利技术涉及文本数据处理
，具体涉及一种文本信息的处理方法、装置、设备及可读存储介质。

技术介绍

[0002]在深度学习文本检测算法的数据处理阶段，通常采用文本裁剪这一方式对文本数据进行增强处理，但是，若文本裁剪过程中存在多余的文本框信息或缺少文本框信息的有效文本，这都将会为后续文本检测模型的训练引入错误信息，进而影响文本检测模型的检测性能。因此，如何保证裁剪结果中的有效文本均保留有效的文本框信息，并且无效文本均不包含有效文本框信息，成为亟待解决的技术问题。

技术实现思路

[0003]有鉴于此，本专利技术实施例提供了一种文本信息的处理方法、装置、设备及可读存储介质，以解决裁剪结果中的有效文本信息及其有效文本框难以保证的问题。
[0004]根据第一方面，本专利技术实施例提供了一种文本信息的处理方法，包括：获取待处理文本图片对应的初始化图片以及所述待处理文本图片的标注文本框，所述初始化图片为像素值为0的单通道图片，且所述初始化图片的尺寸...

【技术保护点】

【技术特征摘要】
1.一种文本信息的处理方法，其特征在于，包括：获取待处理文本图片对应的初始化图片以及所述待处理文本图片的标注文本框，所述初始化图片为像素值为0的单通道图片，且所述初始化图片的尺寸信息与所述待处理文本图片的尺寸信息一致；基于所述标注文本框的属性信息，在所述初始化图片中生成对应于多个标注文本框的文本掩膜，确定所述文本掩膜对应的多个目标文本框；基于所述标注文本框与所述目标文本框的像素信息，剔除无效文本信息对应的无效文本框，得到所述待处理文本图片中的有效文本信息及其对应的有效文本框。2.根据权利要求1所述的方法，其特征在于，所述基于所述标注文本框的属性信息，在所述初始化图片中生成对应于多个标注文本框的文本掩膜，确定所述文本掩膜对应的多个目标文本框，包括：获取所述标注文本框的标注顺序以及文本框坐标信息；基于所述标注顺序以及所述文本框坐标信息，在所述初始化图片中生成文本掩膜，所述文本掩膜的像素值为所述标注文本框的标注顺序序号；根据所述文本掩膜确定出所述初始化图片中的多个所述目标文本框。3.根据权利要求1所述的方法，其特征在于，所述基于所述标注文本框与所述目标文本框的像素信息，剔除无效文本信息对应的无效文本框，得到所述待处理文本图片中的有效文本信息及其对应的有效文本框，包括：获取所述标注文本框的第一像素点数目与所述目标文本框的第二像素点数目；计算所述第一像素点数目与所述第二像素点数目之间的比值；判断所述比值是否小于预设阈值；当所述比值小于所述预设阈值时，判定所述标注文本框中的文本信息为无效文本信息；剔除所有的所述无效文本信息对应的无效文本框，得到所述待处理文本图片中的有效文本信息及其对应的有效文本框。4.根据权利要求3所述的方法，其特征在于，还包括：获取所述标注文本框的边界信息；基于所述边界信息从所述待处理文本图片中确定与所述标注文本框不存...

【专利技术属性】
技术研发人员：吴增程，
申请(专利权)人：广州视源人工智能创新研究院有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人