【技术实现步骤摘要】
文本检测方法、模型的训练方法、装置、电子设备及介质
[0001]本公开涉及人工智能
,尤其涉及深度学习、图像处理、计算机视觉
,可应用于OCR等场景。具体涉及文本检测方法、深度学习模型的训练方法、装置、电子设备、存储介质以及程序产品。
技术介绍
[0002]OCR(Optical Character Recognition,光学字符识别),可以是指利用文本检测方法以及文本识别方法,将待检测图像中的文本内容进行检测、识别并转换为计算机可以处理的语言的技术。OCR是自动识别技术研究和应用领域中的一个重要方面。
[0003]随着图像数据量爆炸式增长,海量的数据源以及丰富的数据层次,使得待检测图像中的文本内容的类型越来越广泛,进而对OCR技术的要求也越来越高。
技术实现思路
[0004]本公开提供了一种文本检测方法、深度学习模型的训练方法、装置、电子设备、存储介质以及程序产品。
[0005]根据本公开的一方面,提供了一种文本检测方法,包括:对待检测图像进行图像特征提取,得到全局特征图;对上述全局特征图进行分类,得到分类结果;基于上述分类结果,从多个检测模式中确定目标检测模式;以及按照上述目标检测模式处理上述全局特征图,得到上述待检测图像的文本检测结果。
[0006]根据本公开的另一方面,提供了一种深度学习模型的训练方法,包括:对样本图像进行图像特征提取,得到样本全局特征图;按照多个检测模式分别处理上述样本全局特征图,得到多个样本文本检测结果;基于上述多个样本文本检测结果,确 ...
【技术保护点】
【技术特征摘要】
1.一种文本检测方法,包括:对待检测图像进行图像特征提取,得到全局特征图;对所述全局特征图进行分类,得到分类结果;基于所述分类结果,从多个检测模式中确定目标检测模式;以及按照所述目标检测模式处理所述全局特征图,得到所述待检测图像的文本检测结果。2.根据权利要求1所述的方法,其中,所述对所述全局特征图进行分类,得到分类结果,包括:对所述全局特征图进行第一卷积操作,得到第一卷积后的全局特征图;以及对所述第一卷积后的全局特征图进行分类,得到所述分类结果。3.根据权利要求1或2所述的方法,其中,所述基于所述分类结果,从多个检测模式中确定目标检测模式,包括:在确定所述分类结果为分割分类结果的情况下,确定所述目标检测模式为分割检测模式;以及在确定所述分类结果为回归分类结果的情况下,确定所述目标检测模式为回归检测模式。4.根据权利要求3所述的方法,其中,所述目标检测模式包括回归检测模式;所述按照所述目标检测模式处理所述全局特征图,得到所述待检测图像的文本检测结果,包括:对所述全局特征图进行第二卷积操作,得到第二卷积后的全局特征图;以及对所述第二卷积后的全局特征图进行非极大值抑制处理,得到所述待检测图像的文本检测结果。5.根据权利要求3所述的方法,其中,所述目标检测模式包括分割检测模式;所述按照所述目标检测模式处理所述全局特征图,得到所述待检测图像的文本检测结果,包括:对所述全局特征图进行第三卷积操作,得到第三卷积后的全局特征图;以及对所述第三卷积后的全局特征图进行连通域标记处理,得到所述待检测图像的所述文本检测结果。6.一种深度学习模型的训练方法,包括:对样本图像进行图像特征提取,得到样本全局特征图;按照多个检测模式分别处理所述样本全局特征图,得到多个样本文本检测结果;基于所述多个样本文本检测结果,确定所述样本图像的分类标签;将所述样本全局特征图输入至深度学习模型中,得到样本分类结果;以及利用所述样本分类结果和所述分类标签,训练所述深度学习模型,得到经训练的深度学习模型。7.根据权利要求6所述的方法,其中,所述基于所述多个样本文本检测结果,确定所述样本图像的分类标签,包括:从所述多个样本文本检测结果中确定目标样本文本检测结果;确定与所述目标样本文本检测结果相匹配的目标样本检测模式;以及将与所述目标样本检测模式相对应的预定分类标签作为所述样本图像的分类标签。
8.一种文本检测装置,包括:提取模块,用于对待检测图像进行图像特征提取,得到全局特征图;分类模块,用于对所述全局特征图进行分类,得到分类结果;确定模块,用于基于所述分类结果,从多个检测模式中确定目标检测模式;以及检测模块,用于按照所述目标检测模式处理所述全局特征图,得到所述待检测图像的文本检测结果。9....
【专利技术属性】
技术研发人员:范森,吕鹏原,王晓燕,乔美娜,刘珊珊,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。