【技术实现步骤摘要】
一种文本检测方法、装置及电子设备
本公开涉及图像处理
,尤其涉及一种文本检测方法、装置及电子设备。
技术介绍
当前OCR(OpticalCharacterRecognition,光学字符识别)检测在各个领域中的应用越来越广泛,所谓OCR是指:对文本资料进行扫描后,对扫描得到的图像进行分析处理,从而获取该图像中的文字及版面信息的过程。其中,在进行OCR检测时,由于扫描时文本资料所摆放角度、扫描仪器的物理参数限制等原因,所得到的图像中,各文本行所在的文本区域可能是倾斜的。基于此,在OCR检测过程中,当使用当前所存在的各种目标对象检测方法时,由于无法检测到倾斜的文本区域,因此,导致所检测得到的文本区域的准确率较低,从而大大降低了所获取到的图像中的文字的准确性。
技术实现思路
本公开提供一种文本检测方法、装置、电子设备及存储介质,以至少解决相关技术中在OCR检测过程中,由于无法检测到倾斜的文本区域所导致的所检测得到的文本区域的准确率较低,降低了所获取到的图像中的文字的准确性的问题。本公开的技 ...
【技术保护点】
1.一种文本检测方法,其特征在于,所述方法,包括:/n获取待检测图像;/n从所述待检测图像中,确定关于文本行的备选区域;/n确定所述备选区域的锚点特征;其中,所述锚点特征包括所述备选区域的倾斜角度和尺寸特征两类特征信息;/n利用所述备选区域的锚点特征,以及预设的锚点数据与文本行识别结果的对应关系,确定所述备选区域是否为文本行;其中,所述文本行识别结果用于表征区域是否为文本行的结果;所述锚点数据为基于预设的多个样本锚点特征所确定出的数据;/n当所述备选区域为文本行时,将所述备选区域的内容确定为所检测得到的目标文本。/n
【技术特征摘要】
1.一种文本检测方法,其特征在于,所述方法,包括:
获取待检测图像;
从所述待检测图像中,确定关于文本行的备选区域;
确定所述备选区域的锚点特征;其中,所述锚点特征包括所述备选区域的倾斜角度和尺寸特征两类特征信息;
利用所述备选区域的锚点特征,以及预设的锚点数据与文本行识别结果的对应关系,确定所述备选区域是否为文本行;其中,所述文本行识别结果用于表征区域是否为文本行的结果;所述锚点数据为基于预设的多个样本锚点特征所确定出的数据;
当所述备选区域为文本行时,将所述备选区域的内容确定为所检测得到的目标文本。
2.根据权利要求1所述的方法,其特征在于,所述锚点数据与文本行识别结果的对应关系包括:锚点类别与文本行识别结果的对应关系;
所述利用所述备选区域的锚点特征,以及预设的锚点数据与文本行识别结果的对应关系,确定所述备选区域是否为文本行的步骤,包括:
确定所述备选区域的锚点特征所属的目标锚点类别;
利用所述目标锚点类别,以及预设的锚点类别与文本行识别结果的对应关系,确定所述备选区域是否为文本行。
3.根据权利要求2所述的方法,其特征在于,所述关于锚点类别与文本行识别结果的对应关系的确定方式,包括:
获取第一样本图像的特征图,以及基于第二样本图像中各个文本行的锚点特征得到的各个锚点类别;
基于所述特征图和所述各个锚点类别,进行关于文本区域的类别回归和检测框回归,得到多个初始文本区域;
在所述特征图中截取各个初始文本区域对应的待回归文本区域;
对所截取到的多个待回归文本区域进行类别回归、检测框回归和角度回归,得到关于锚点类别与文本行识别结果的对应关系。
4.根据权利要求3所述的方法,其特征在于,所述各个锚点类别的确定方式,包括:
确定所述第二样本图像中各个文本行的倾斜角度和尺寸特征,得到角度数据组和尺寸数据组;
对所述角度数据组和所述尺寸数据组分别进行聚类,得到第一数量个角度聚类结果和第二数据量个尺寸聚类结果;
从所述第一数量个角度聚类结果和所述第二数据量个尺寸聚类结果中,分别选取一个聚类结果的聚类中心,构成一个锚点类别,得到锚点类别;其中,不同锚点类别包括的两类特征信息不完全相同。
5.根据权利要求3或4所述的方法,其特征在于,在所述对所截取到的多个待回归文本区域进行类别回归、检测框回归和角度回归的步骤之前,所...
【专利技术属性】
技术研发人员:张水发,
申请(专利权)人:北京达佳互联信息技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。