【技术实现步骤摘要】
【国外来华专利技术】文本检测方法、装置及存储介质
本专利技术实施例涉及图像处理
,特别是涉及一种文本检测方法、装置及存储介质。
技术介绍
随着通信技术的发展,用户可以方便地通过智能终端采集感兴趣的图像,获取图像中包含的文字信息。智能终端可以根据图像中包含的文字进行识别,进而根据识别结果将图像中的文字转换为可编辑的文本,实现对图像中文本信息的二次编辑和快速分享。文本检测是文本识别的前提步骤,通过文本检测确定文字在图像中的所在区域。目前的检测方法可以分为两类:一类是单字检测,然后合并检测框;一类是检测框回归,主要是通过神经网络检测输出很多候选矩形框,然后再基于这些候选矩形框进行非极大值抑制筛选出最终的检测框。单字检测的标注工作量很大,难以得到大规模的训练数据。检测框回归筛选出来的矩形框不是存在交叉区域,就是无法完全覆盖原始的文本区域,导致多检或漏检。
技术实现思路
本专利技术实施例提供的文本检测方法、装置及存储介质,提高获取文本检测框的精度。为达到上述目的,本专利技术提供如下技术方案:本专利技术的第一方面提 ...
【技术保护点】
一种文本检测方法,其特征在于,包括:/n通过神经网络模型获取目标图像中包括文字区域的掩码图;/n基于所述掩码图获取所述文字区域的第一检测框;/n若所述第一检测框满足预设切割条件,则对所述第一检测框进行切割,得到第二检测框;/n将所述第二检测框对应的图像作为文本检测结果。/n
【技术特征摘要】
【国外来华专利技术】一种文本检测方法,其特征在于,包括:
通过神经网络模型获取目标图像中包括文字区域的掩码图;
基于所述掩码图获取所述文字区域的第一检测框;
若所述第一检测框满足预设切割条件,则对所述第一检测框进行切割,得到第二检测框;
将所述第二检测框对应的图像作为文本检测结果。
根据权利要求1所述的方法,其特征在于,所述神经网络模型是采用卷积神经网络U-Net结构对标注有文字真值框的图像数据进行训练得到的。
根据权利要求1所述的方法,其特征在于,所述基于所述掩码图获取所述文字区域的第一检测框,包括:
提取所述掩码图的外部轮廓;
对所述外部轮廓进行拟合,得到所述文字区域的第一检测框。
根据权利要求3所述的方法,其特征在于,所述若所述第一检测框满足预设切割条件,则对所述第一检测框进行切割,得到第二检测框,包括:
若所述外部轮廓的面积与所述第一检测框的面积的比值小于预设比值,且,所述第一检测框的长宽比大于预设长宽比,则对所述第一检测框进行切割,得到第二检测框。
根据权利要求4所述的方法,其特征在于,所述对所述第一检测框进行切割,得到第二检测框,包括:
根据所述预设长宽比对所述第一检测框进行等比例分割,得到至少两个所述第二检测框。
根据权利要求1所述的方法,其特征在于,所述将所述第二检测框对应的图像作为文本检测结果,包括:
判断所述第二检测框的切割点的连线是否切...
【专利技术属性】
技术研发人员:柯福全,王喜顺,王俊,
申请(专利权)人:北京比特大陆科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。