文档图像中文字高度的分布情况估计方法及装置制造方法及图纸

技术编号：35018592 阅读：14 留言：0更新日期：2022-09-24 22:45

本发明专利技术提供一种文档图像中文字高度的分布情况估计方法及装置，所述方法包括：获取第一样本训练集；基于所述第一样本训练集对初始网络模型进行训练，得到字高检测模型；将待检测文档图像缩放至不同比例并输入至所述字高检测模型，获得不同比例下的所述待检测文档图像对应的文字高度识别结果；基于获取到的不同比例下的所述待检测文档图像对应的文字高度识别结果建立各比例待检测文档图像的待分类文字高度分布图；将所述待分类文字高度分布图输入至分类器模型，获得所述待检测文档图像的最优缩放比例，并基于所述最优缩放比例对应的文字高度确定所述待检测文档图像的字高分布情况。该方法可准确的检测到文档图像上的文字高度分布情况。高度分布情况。高度分布情况。

全部详细技术资料下载

【技术实现步骤摘要】
文档图像中文字高度的分布情况估计方法及装置

[0001]本专利技术涉及计算机信息
，尤其涉及一种文档图像中文字高度的分布情况估计方法及装置。

技术介绍

[0002]目前在电子文档的阅读以及OCR识别等应用场景都需要解决如何将图像放缩至符合视觉的大小的问题。具体来说在OCR的输入预处理阶段需要将图像放缩至合适大小，这样可以显著提升OCR识别的正确率；而在采用阅读器阅读PDF页面或在浏览器页面浏览文字类网页的时候，将页面图像放缩至合适位置，使页面中文字大小调整到适合阅读的大小，可以提升用户阅读的体验。
[0003]现有的PDF页面或文字类网页图像放缩时，一般是用户根据阅读爱好将其阅读或浏览的含有文字的图像放缩至自己想要的大小。由于现有方法无法准确识别图像中文字的高度分布情况，因而在图像放缩过程中难以保证以较佳的放缩比例进行放缩，因此如何准确的检测到图像上的文字高度分布情况是亟待解决的技术问题。

技术实现思路

[0004]有鉴于此，本专利技术提供了一种文档图像中文字高度的分布情况估计方法及装置，以解决现有技术中存在的一个或多个问题。
[0005]根据本专利技术的一个方面，本专利技术公开了一种文档图像中文字高度的分布情况估计方法，所述方法包括：
[0006]获取第一样本训练集，所述第一样本训练集中的样本数据包括文字块图像及文字高度；
[0007]基于所述第一样本训练集对初始网络模型进行训练，得到字高检测模型；
[0008]将待检测文档图像缩放至不同比例并输入至所述...

【技术保护点】

【技术特征摘要】
1.一种文档图像中文字高度的分布情况估计方法，其特征在于，所述方法包括：获取第一样本训练集，所述第一样本训练集中的样本数据包括文字块图像及文字高度；基于所述第一样本训练集对初始网络模型进行训练，得到字高检测模型；将待检测文档图像缩放至不同比例并输入至所述字高检测模型，获得不同比例下的所述待检测文档图像对应的文字高度识别结果；基于获取到的不同比例下的所述待检测文档图像对应的文字高度识别结果建立各比例待检测文档图像的待分类文字高度分布图；其中，所述待分类文字高度分布图的横轴表示实际字高，纵轴表示相应字高的文字数量与总文字数量的比值；将所述待分类文字高度分布图输入至分类器模型，获得所述待检测文档图像的最优缩放比例，并基于所述最优缩放比例对应的文字高度确定所述待检测文档图像的字高分布情况。2.根据权利要求1所述的文档图像中文字高度的分布情况估计方法，其特征在于，获取第一样本训练集，包括：获取文档图像，将所述文档图像切割为多个文字块图像，标注各所述文字块图像的文字高度；将所述文字块图像中的在高度方向上被切割的文字进行马赛克处理。3.根据权利要求2所述的文档图像中文字高度的分布情况估计方法，其特征在于，获取第一样本训练集，还包括：随机生成文档图像，并在生成的所述文档图像的各区域添加识别干扰项，所述识别干扰项包括纯白背景、高斯噪声、晶体、椒盐噪声和真实环境信息中的至少一个；和/或对所述文字块图像进行数据增强及旋转，调整所述文字块图像的亮度、对比度、饱和度和色调。4.根据权利要求3所述的文档图像中文字高度的分布情况估计方法，其特征在于，所述方法包括：构建高度损失函数，所述高度损失函数为：其中，HLoss表示高度损失，H1＝min(D1，D3)+min(D2，D4)，H2＝D1+D2+D3+D4‑
H1，D1为预测的像素点至文字块图像顶部之间的距离，D2为预测的像素点至文字块图像底部之间的距离，D3为标注的像素点至文字块图像顶部之间的距离，D4为标注的像素点至文字块图像底部之间的距离。5.根据权利要求4所述的文档图像中文字高度的分布情况估计方法，其特征在于，当获...

【专利技术属性】
技术研发人员：熊永平，丁运运，黄思远，伍贵宾，
申请(专利权)人：北京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人