一种文本位置检测及文本角度检测方法及装置制造方法及图纸

技术编号:38083145 阅读:21 留言:0更新日期:2023-07-06 08:49
本申请公开了一种文本位置检测及文本角度检测方法及装置。所述文本位置检测及文本角度检测方法包括:获取经过文本位置以及文本角度训练后的预测模型;获取待检测公文;将所述待检测公文输入至经过文本位置以及文本角度训练后的预测模型,从而获取待检测公文中各个文本的文本位置以及文本角度。本申请所提供的文本位置检测及文本角度检测方法所使用的预测模型能够同时获取到各个文本的文本位置以及文本角度,从而简化了在文字识别之前的流程,也提升了ocr识别速度。也提升了ocr识别速度。也提升了ocr识别速度。

【技术实现步骤摘要】
一种文本位置检测及文本角度检测方法及装置


[0001]本申请涉文本检测
,尤其涉及一种文本位置检测及文本角度检测方法以及文本位置检测及文本角度检测装置。

技术介绍

[0002]公文是法定机关或者其他社会组织在公务活动中具有法律效力和规范的文体,在对国家重要的方针政策,沟通各方相关信息、发布法规章程等方面有着至关重要的作用。随着国家机关和各种组织的业务不断增多,对公文需求也愈加强烈。其中,公文的格式也包含很多,比如word、txt、pdf、OFD等文件格式,还有扫描件和jpg、png等图片格式。为了帮助政府机关、企事业办公人员安全、智能、高效地完成工作,方便存储、查找、修改、撰写公文等,对于扫描件和图片格式的公文就离不开OCR文字识别技术。而想要识别文字,首先要检测到文字的位置,也就是文本检测算法。
[0003]现有的文本检测主要分为两个阶段:基于传统方法的文本检测和基于深度学习的文本检测方法。
[0004]1.基于传统方法的文本检测
[0005]主要是基于图像的二值图的连通域来判断该区域是否包含文字。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本位置检测及文本角度检测方法,其特征在于,所述文本位置检测及文本角度检测方法包括:获取经过文本位置以及文本角度训练后的预测模型;获取待检测公文;将所述待检测公文输入至经过文本位置以及文本角度训练后的预测模型,从而获取待检测公文中各个文本的文本位置以及文本角度。2.如权利要求1所述的文本位置检测及文本角度检测方法,其特征在于,所述预测模型包括特征提取层、特征融合层、文字区域判断头以及文字方向判断头,其中,所述特征提取层用于提取所述待检测公文的公文特征;所述特征融合层用于将所述特征提取层所提取的公文特征融合,从而形成融合特征;所述文字区域判断头用于接收所述融合特征,并根据融合特征生成文字区域判断结果;所述文字方向判断头用于接收所述融合特征,并根据融合特征生成文字方向判断结果。3.根据权利要求2所述的文本位置检测及文本角度检测方法,其特征在于,所述文本位置检测及文本角度检测方法进一步包括:对所述预测模型进行训练。4.根据权利要求3所述的文本位置检测及文本角度检测方法,其特征在于,所述对所述预测模型进行训练包括:获取训练集,所述训练集包括多个训练图像信息;分别对每个训练图像信息进行数据增强,从而生成增强数据集;通过增强数据集对所述预测模型进行训练,从而获取经过文本位置以及文本角度训练后的预测模型。5.如权利要求4所述的文本位置检测及文本角度检测方法,其特征在于,所述分别对每个训练图像信息进行数据增强,从而生成增强数据集包括:分别对每个训练图像进行如下处理:对训练图像进行至少一次的角度变换,每变换一次角度,生成一个增强训练图像,各个增强训练图像以及训练图像组成所述增强数据集。6.如权利要求5所述的文本位置检测及...

【专利技术属性】
技术研发人员:张杰马延美
申请(专利权)人:北京方寸无忧科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1