文本检测方法及系统技术方案

技术编号:46393903 阅读:9 留言:0更新日期:2025-09-16 19:46
本申请提供了一种文本检测方法及系统,其中,所述方法包括:将待检测的第一图像输入至图预测模型,获得所述图预测模型生成的所述第一图像的第一概率图和第一阈值图,并基于所述第一概率图和第一阈值图,计算得到所述第一图像的第一近似二值图;根据所述第一近似二值图,在所述第一阈值图上向外搜索具有平均阈值最高的边界框,得到所述第一图像中的文本框。本申请能够准确定位文本框的位置,提高后续文本识别的准确性。

【技术实现步骤摘要】

本申请涉及光学字符识别(optical character recognition,ocr)与机器学习,具体涉及一种文本检测方法及系统


技术介绍

1、场景文本检测任务旨在定位图像中的文本实例,对于当前输入的图像,检测并返回图像中的文本实例,文本检测任务在现实世界中有着丰富的应用,包括办公自动化、视觉搜索和地理定位等,因此具有重要意义。

2、对于任意形状的场景文本检测任务,目前业界最流行的方法是使用基于分割的方法,例如,可微分二值化(differentiable binarization,db)算法。基于分割的场景文本检测,把分割算法产生的概率图(热力图)转化为边界框和文字区域,其中包含二值化的后处理过程。现有技术的基于分割的方法,在后处理阶段难以准确定位文本框的位置,容易发生文本框过于靠近文字边缘或离文字边缘过远的问题,从而影响了后续文本识别的准确性。


技术实现思路

1、本申请的至少一个实施例提供了一种文本检测方法及系统,能够准确定位文本框的位置,提高后续文本识别的准确性。</p>

2、根据本文档来自技高网...

【技术保护点】

1.一种文本检测方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,根据所述第一近似二值图,在所述第一阈值图上向外搜索具有平均阈值最高的边界框,得到所述第一图像中的文本框,包括:

3.如权利要求1所述的方法,其特征在于,所述图预测模型包括图像特征提取模块、概率图和阈值图预测模块、二值图计算模块,所述方法还包括:

4.如权利要求3所述的方法,其特征在于,生成所述样本图像的文本框边界权重矩阵,包括:

5.如权利要求3所述的方法,其特征在于,所述样本图像的真值阈值图和预测阈值图之间的损失为:所述样本图像的真值阈值图和预测阈值图各个像...

【技术特征摘要】

1.一种文本检测方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,根据所述第一近似二值图,在所述第一阈值图上向外搜索具有平均阈值最高的边界框,得到所述第一图像中的文本框,包括:

3.如权利要求1所述的方法,其特征在于,所述图预测模型包括图像特征提取模块、概率图和阈值图预测模块、二值图计算模块,所述方法还包括:

4.如权利要求3所述的方法,其特征在于,生成所述样本图像的文本框边界权重矩阵,包括:

5.如权利要求3所述的方法,其特征在于,所述样本图像的真值阈值图和预测阈值图之间的损失为:所述样本图像的真值阈值图和预测阈值图各个像素点之间的曼哈顿距离...

【专利技术属性】
技术研发人员:程瑞董滨姜珊珊丁磊罗璐
申请(专利权)人:株式会社理光
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1