用于分离被检测为一个文本边界框的单词的文本检测算法制造技术

技术编号:38377341 阅读:18 留言:0更新日期:2023-08-05 17:37
本发明专利技术涉及一种用于分离被检测为一个文本边界框的单词的文本检测算法。提供了一种用于文本检测的方法、计算机系统和计算机程序产品。本发明专利技术可以包括训练文本检测模型。本发明专利技术可以包括使用经训练的文本检测模型对输入图像执行文本检测。本发明专利技术可以包括确定使用输入图像生成的多个边界框中的至少一个边界框是否具有高于阈值的纵横比。本发明专利技术可以包括基于确定使用输入图像生成的多个边界框中的至少一个边界框具有高于阈值的纵横比,放大该至少一个边界框内的任何文本,并且使用经训练的文本检测模型对新图像执行文本检测。本发明专利技术可包括将输出图像进行输出。括将输出图像进行输出。括将输出图像进行输出。

【技术实现步骤摘要】
用于分离被检测为一个文本边界框的单词的文本检测算法


[0001]本专利技术总体上涉及计算领域,并且更具体地,涉及文本检测算法。

技术介绍

[0002]以小字体大小描绘的文本行可能由文本检测算法仅使用一个文本边界框来检测,其中文本检测模型不能将一行文本与另一行文本相分离。这可导致丢失的单词(例如,出现在文本行中的单词被文本检测算法忽略)。

技术实现思路

[0003]本专利技术的实施例公开了一种用于文本检测的方法、计算机系统和计算机程序产品。本专利技术可以包括训练文本检测模型。本专利技术可以包括使用经训练的文本检测模型对输入图像执行文本检测。本专利技术可以包括确定使用所述输入图像生成的多个边界框中的至少一个边界框是否具有高于阈值的纵横比。本专利技术可以包括基于确定使用所述输入图像生成的所述多个边界框中的至少一个边界框具有高于所述阈值的所述纵横比,放大所述至少一个边界框内的任何文本,并且使用经训练的文本检测模型对新图像执行文本检测。本专利技术可包括将输出图像进行输出。
附图说明
[0004]从以下将结合附图阅读的对本专本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于文本检测的方法,所述方法包括:训练文本检测模型;使用经训练的文本检测模型对输入图像执行文本检测;确定使用所述输入图像生成的多个边界框中的至少一个边界框是否具有高于阈值的纵横比;基于确定使用所述输入图像生成的所述多个边界框中的至少一个边界框具有高于所述阈值的所述纵横比,放大所述至少一个边界框内的任何文本,并且使用经训练的文本检测模型对新图像执行文本检测;以及将输出图像进行输出。2.根据权利要求1所述的方法,其中,所述经训练的文本检测模型是神经网络,所述神经网络通过将所述输入图像中的每个像素标记为文本或不标记为文本并且将使用所述输入图像生成的所述多个边界框中的一个边界框放置在被标记为文本的一组并发像素周围,来预测单词或文本行。3.根据权利要求2所述的方法,其中,基于所述边界框内的被标记为文本的所述一组并发像素,计算高斯分布。4.根据权利要求1所述的方法,其中,所述阈值是针对最长单词计算的边界框的高度除以边界框的宽度的两倍。5.根据权利要求1所述的方法,其中,放大所述至少一个边界框内的所述文...

【专利技术属性】
技术研发人员:O
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1