【技术实现步骤摘要】
文本检测方法、装置、电子设备以及存储介质
[0001]本公开涉及图像处理、模式识别
,尤其涉及文本检测方法、装置、电子设备以及存储介质。
技术介绍
[0002]在相关技术中,在进行文本检测时,基于锚文本(Anchor
‑
based)类的方法针对的是正矩形的文本预测结果,而无法应对不同程度的旋转以及不规则形状的文字形状。
技术实现思路
[0003]本公开提供了一种用于文本检测的方法、装置、设备以及存储介质。
[0004]根据本公开的一方面,提供了一种文本检测的方法,包括:获取目标图像,其中,目标图像包括待检测的目标文本;确定目标文本的外接矩形和目标四边形的多个第一角点,其中,外接矩形为外接于目标文本的最小正矩形,目标四边形为由目标文本上的多个目标点确定,且包括目标文本;基于外接矩形检测多个第一角点的目标位置信息。
[0005]可选地,基于外接矩形检测多个第一角点的目标位置信息,该方法包括:确定每个第一角点相对于外接矩形中的第二角点的偏移位置信息;基于偏移位置信息确定每个第 ...
【技术保护点】
【技术特征摘要】
1.一种文本检测方法,包括:获取目标图像,其中,所述目标图像包括待检测的目标文本;确定所述目标文本的外接矩形和目标四边形的多个第一角点,其中,所述外接矩形为外接于所述目标文本的最小正矩形,所述目标四边形为由所述目标文本上的多个目标点确定,且包括所述目标文本;基于所述外接矩形检测所述多个第一角点的目标位置信息。2.根据权利要求1所述的方法,其中,基于所述外接矩形检测所述多个第一角点的目标位置信息包括:确定每个所述第一角点相对于所述外接矩形中的第二角点的偏移位置信息;基于所述偏移位置信息确定每个所述第一角点的目标位置信息。3.根据权利要求2所述的方法,基于所述偏移位置信息确定每个所述第一角点的目标位置信息包括:基于所述偏移位置信息和所述外接矩形的尺寸,确定每个所述第一角点的目标位置信息。4.根据权利要求3所述的方法,基于所述偏移位置信息和所述外接矩形的尺寸,确定每个所述第一角点的目标位置信息包括:基于所述外接矩形的长、宽、中心点的位置信息,对所述偏移位置信息进行调整,得到每个所述第一角点的目标位置信息。5.根据权利要求1所述的方法,基于所述外接矩形检测所述多个第一角点的目标位置信息包括:基于第一目标模型对所述外接矩形的尺寸进行处理,得到每个所述第一角点的所述目标位置信息,其中,所述第一目标模型为基于目标图像样本中文本样本的外接矩形样本的尺寸和所述文本样本的四边形样本进行训练而得到,所述外接矩形样本为外接于所述文本样本的最小正矩形,所述四边形样本由所述文本样本上的多个目标点样本确定,且包括所述文本样本。6.根据权利要求1所述的方法,其中,还包括:确定与所述目标文本所属的文本对应的多个锚点框;分别基于所述多个锚点框对所述文本进行检测,得到多个目标检测结果,其中,所述多个目标检测结果与所述多个锚点框一一对应,且每个所述目标检测结果用于表示一个所述目标文本的检测结果。7.根据权利要求6所述的方法,其中,所述多个目标检测结果对应的多个所述目标文本中至少两个所述目标文本重叠。8.根据权利要求6所述的方法,其中,所述方法还包括:获取所述目标图像的多个特征图;确定与所述目标文本所属的文本对应的多个锚点框包括:基于每个所述特征图的尺寸确定所述多个锚点框的尺寸。9.根据权利要求6所述的方法,其中,分别基于所述多个锚点框对所述目标文本进行检测,得到多个目标检测结果包括:基于每个所述锚点框和对应的所述目标文本的外接矩形对所述目标文本进行检测,得
到每个所述目标检测结果。10.根据权利要求1至9中任意一项所述的方法,所述外接矩形与所述目标四边形不重合。11.根据权利要求1至9中任意一项所述的方法,所述目标文本为一个文本行。12.一种文本检测装置,包括:获取单元,用于获取目标图像,其中,所述目标图像包括待检测的目标文本;确定单元,用于确定所述目标文本的外接矩形和目标四边形的多个第一角点,其中,所述外接矩形为外接于所述目标文本的最小正矩形,所述目标四边形为由所述目标文本上的多个目标点确定,且包括所述目标文本;检测单元,用于基于所述外接矩形检测所述多个第一角点的目标位置信息。13.根据权利要求12所述的装置,其中,所述检测单元包括:第一确定模块,用于确定每个所述第一角点相对于所述外接矩形中的第二角点之间的偏移位置信息;第二...
【专利技术属性】
技术研发人员:黄聚,谢群义,李煜林,钦夏孟,姚锟,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。