文字检测系统、训练方法及检测方法技术方案

技术编号：34099863 阅读：31 留言：0更新日期：2022-07-11 23:11

本发明专利技术公开一种文字检测系统、训练方法及检测方法。文字检测系统包括预处理单元、基础网络单元、目标定位单元、输出处理单元。其中：预处理单元用以对输入的图片进行预处理，用以作为基础网络单元的输入图像；基础网络单元用以对输入图像进行特征抽取，获得特征图；目标定位单元用以对特征图进行定位；输出处理单元用以对目标定位单元定位的目标进行处理，得到文字目标。本发明专利技术针对文字检测准确率不高的技术缺陷提出的技术方案，能够大大提高对复杂背景的文字检测鲁棒性。景的文字检测鲁棒性。景的文字检测鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
文字检测系统、训练方法及检测方法

[0001]本专利技术涉及人工智能
，尤其涉及文字检测系统、训练方法及检测方法。

技术介绍

[0002]文字检测任务是找出图像或视频中人们感兴趣的物体，并同时检测出它们的位置和大小。文字检测技术发展至今已经有几十年的时间，从技术的发展脉络看，可以划分为传统文字检测算法时期(2014年之前)以及之后的基于机器学习的文字检测算法。
[0003]传统文字检测算法主要基于手工提取特征，手工的缺陷主要在于计算量大，识别效果比较差，而且人工成本也非常高。随着机器学习的各种新算法成熟，文字检测技术得到了质的飞跃，基于CNN以及YOLO的各种文字检测算法不断创新出来，大大提高了文字检测的识别能力和准确率。
[0004]这些层出不穷的新算法和新模型，功能越来越强大，网络深度也越来越深，网络结构也越来越复杂，而模型过大，其带来的问题就是其计算成本就越来越高，速度也受到了影响，因此无法在移动设备端使用和部署，因为移动端设备内存较小，同时移动设备计算量相当于服务器较低，导致文字检测模型不能部署...

【技术保护点】

【技术特征摘要】
1.一种文字检测系统，其特征是，包括预处理单元、基础网络单元、目标定位单元、输出处理单元，其中：预处理单元用以对输入的图片进行预处理，用以作为基础网络单元的输入图像；基础网络单元用以对输入图像进行特征抽取，获得特征图；目标定位单元用以对特征图进行定位；输出处理单元用以对目标定位单元定位的目标进行处理，得到文字目标。2.如权利要求1所述的文字检测系统，其特征是，基础网络单元为对多个基础网络模块构成，每个基础网络模块为：对输入经过2次卷积得到第一特征图，对输入经过1次卷积和多次残差模块得到第二特征图，将第一特征图和第二特征图进行concat后，再经过1次卷积输出。3.如权利要求1所述的文字检测系统，其特征是，基础网络单元还包括池化模块，用以处理不同纵横比和不同尺寸的输入图像的问题，其结构为：将输入图像复制为多份，对其中进行间隔采样，并进行框处理，再和特征图在通道维度上进行拼接，最后经过CSP结构输出。4.如权利要求2或3所述的文字检测系统，其特征是，基础网络单元还包括嵌入模块，用以将先验的隐式知识传递到基础网络单元的的显性知识中，其结构为：将多个输出特征图分别在经过1次卷积后，叠加到一维正态分布的先验矩阵中，再分别经过1次卷积后，乘以另一个一维正态分布的先验矩阵。5.如权利要求1所述的文字检测系统，其特征是，预处理单元包括数据增强模块、框处理模块以及切片模块，其中：数据...

【专利技术属性】
技术研发人员：曾祥云，朱姬渊，
申请(专利权)人：上海易康源医疗健康科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人