基于弱监督的字符检测器训练方法、装置、系统及介质制造方法及图纸

技术编号:17995140 阅读:43 留言:0更新日期:2018-05-19 12:17
本发明专利技术提出一种基于弱监督的字符检测器训练方法、装置、文字检测系统及计算机可读存储介质,其中基于弱监督的字符检测器训练方法包括:输入待处理对象的粗粒度标注信息,粗粒度标注信息包括待处理对象的基于词、文本条和/或行的标注信息;对粗粒度标注信息的多边形进行分割,获得所述待处理对象的字符的粗包围盒;根据粗粒度标注信息,通过神经网络模型获得所述待处理对象的字符的预测包围盒;根据粗包围盒和所述预测包围盒确定所述待处理对象的字符的精细包围盒,将所述精细包围盒的标注信息作为所述待处理对象的字符标注。本发明专利技术提供的实施例能够使文字字符检测器利用更多的文字检测数据集进行训练,使模型在字符级别的检测精度显著提高。

Training method, device, system and medium for character detector based on weak supervision

This invention proposes a character detector training method, device, text detection system and computer readable storage medium based on weak supervision, in which the training method of character detector based on weak supervision includes coarse granularity tagging information of the object to be processed, and the coarse granularity tagging information includes the word and text of the object to be processed. The annotation information of this and / or line; a rough bounding box for the characters of the object to be processed by dividing the polygons of the coarse granularity information and obtaining the prediction bounding box for the characters of the objects to be processed by the neural network model according to the rough granularity tagging information; the root is determined by the rough encircling box and the predicted bounding box. The fine bounding box of the characters to be processed is used to mark the annotation information of the fine bounding box as the character of the object to be processed. The embodiment provided by the present invention enables a text character detector to train with more text detection data sets to improve the accuracy of the model at character level.

【技术实现步骤摘要】
基于弱监督的字符检测器训练方法、装置、系统及介质
本专利技术涉及信息
,尤其涉及一种基于弱监督的字符检测器训练方法、装置、文字检测系统及计算机可读存储介质。
技术介绍
在OCR(OpticalCharacterRecognition,光学字符识别)文字检测和识别领域中,由于单个字符级别标注方式(如字符位置的标注)所需花费的人力和物力非常巨大,所以现有的开源的一些真实场景数据集合倾向于标注整个词或者文本条的整体外包围轮廓和整词、整条的文本信息。这样的标注方式,一定程度上缓解了标注的难度和成本,但是也带来了一些负面的影响,如使得一些经典的基于字符级别的文字检测方法没法有效地在这些基于词、文本条标注的真实场景数据上进行训练和调整。从视觉的角度出发,无论语种如何变化,字符是文字的最基准单元。基于字符单元出发的文字检测方法,更容易构建通用场景下(包含水平、多方向、扭曲和透射等)的文字检测引擎。因此根据现有的标注数据集中基于词、文本条或行标注信息自动生成字符标注信息是目前需要解决的问题。
技术实现思路
本专利技术实施例提供一种基于弱监督的字符检测器训练方法、装置、文字检测系统及计算机可读存储介本文档来自技高网...
基于弱监督的字符检测器训练方法、装置、系统及介质

【技术保护点】
一种基于弱监督的字符检测器训练方法,其特征在于,包括:输入待处理对象的粗粒度标注信息,所述粗粒度标注信息包括待处理对象的基于词、文本条和/或行的标注信息;对所述粗粒度标注信息的多边形进行分割,获得所述待处理对象的字符的粗包围盒;根据所述粗粒度标注信息,通过神经网络模型获得所述待处理对象的字符的预测包围盒;根据所述粗包围盒和所述预测包围盒确定所述待处理对象的字符的精细包围盒,将所述精细包围盒的标注信息作为所述待处理对象的字符标注。

【技术特征摘要】
1.一种基于弱监督的字符检测器训练方法,其特征在于,包括:输入待处理对象的粗粒度标注信息,所述粗粒度标注信息包括待处理对象的基于词、文本条和/或行的标注信息;对所述粗粒度标注信息的多边形进行分割,获得所述待处理对象的字符的粗包围盒;根据所述粗粒度标注信息,通过神经网络模型获得所述待处理对象的字符的预测包围盒;根据所述粗包围盒和所述预测包围盒确定所述待处理对象的字符的精细包围盒,将所述精细包围盒的标注信息作为所述待处理对象的字符标注。2.根据权利要求1所述的方法,其特征在于,所述基于词、文本条和/或行的标注信息为词、文本条和/或行的整体外包围轮廓,所述整体外包围轮廓包括多边形或矩形框。3.根据权利要求1所述的方法,其特征在于,对所述粗粒度标注信息的多边形进行分割,获得所述待处理对象的字符的粗包围盒,包括:将所述粗粒度标注信息的多边形进行N等分,其中,与所述多边形的长轴垂直的方向为分割线的方向,N为所述粗粒度标注信息中的字符个数,或者N为所述多边形长轴长度除以最短边长度的商的四舍五入式取整数值。4.根据权利要求1所述的方法,其特征在于,根据所述粗包围盒和所述预测包围盒确定所述待处理对象的字符的精细包围盒,包括:判断第一条件和第二条件是否同时满足,所述第一条件为所述预测包围盒的置信度大于预设的置信度阈值,所述第二条件为所述粗包围盒和所述预测包围盒的交叠比大于预设的交叠比阈值;若所述第一条件和所述第二条件同时满足,则根据所述预测包围盒调整所述粗包围盒,生成所述精细包围盒;若所述第一条件不满足或所述第二条件不满足,则将所述粗包围盒赋值给所述精细包围盒。5.根据权利要求4所述的方法,其特征在于,根据所述预测包围盒调整所述粗包围盒,生成所述精细包围盒,包括:判断所述粗粒度标注信息的多边形长轴与横轴的夹角是否小于等于45°;若是则将所述粗包围盒的上下边界作为所述精细包围盒的上下边界,将所述预测包围盒的左右边界作为所述精细包围盒的左右边界;若否则将所述粗包围盒的上下边界作为所述精细包围盒的左右边界,将所述预测包围盒的左右边界作为所述精细包围盒的上下边界。6.根据权利要求1-5中任一项所述的方法,其特征在于,在根据所述粗包围盒和所述预测包围盒确定所述待处理对象的字符的精细包围盒之后,还包括:根据所述精细包围盒计算所述神经网络模型的损失函数,通过误差反向传播算法更新所述神经网络模型的参数值。7.一种基于弱监督的字符检测器训练装置,其特征在于,包括:输入模块,用于输入待处理对象的粗粒度标注信息,所述粗粒度标注信息包括待处...

【专利技术属性】
技术研发人员:章成全刘家铭韩钧宇丁二锐
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1