一种基于全卷积残差网络的自然场景文本检测方法技术

技术编号:26971407 阅读:25 留言:0更新日期:2021-01-06 00:02
本发明专利技术提供一种基于全卷积残差网络的自然场景文本检测方法,在不同角度摄像头下的预设区域提取自然场景图片,并进行文本位置标签标记,获得训练数据;对训练数据图片进行预处理,然后图片分批次输入到网络中,进入的特征提取主网络中,通过卷积,池化和激活等操作提取不同层级的图像特征;对于所有测试图片进行测试,通过召回率,精确度和综合评价指标共同衡量算法性能优劣;将算法模型集成到相应的系统中,达到可直接使用的目的,达到复杂场景文本检测的目的。本发明专利技术面对密集检测的正负样本不均和困难样本选取,通过引入焦点损失动态修改难易样本权重解决问题,使算法整体性能大幅提升。

【技术实现步骤摘要】
一种基于全卷积残差网络的自然场景文本检测方法
本专利技术属于模式识别
,具体涉及文本检测相关的深度学习方法。
技术介绍
随着智能移动终端的普及,摄像头拍摄的自然场景图像大量涌现,图像中文字随处可见,文字中包含了丰富而精确的语义信息,在人类生产和生活当中一直扮演着十分重要的角色,正确检测自然场景中的文本是基于视觉理解应用(比如:自动驾驶、盲人导航、车牌识别和基于文字的图片检索等)的重要基石。现在越来越多的研究者投入到自然场景的文本检测研究中来,但由于自然场景图像的复杂背景、低分辨率、随意分布等情况,直接识别图像中的文本非常困难,因此,检测图像中文字所在的位置,并将其提取有着重要意义。
技术实现思路
本专利技术针对传统机器学习方法在自然场景文本检测应用中易受目标尺度,图像质量,文本角度等因素影响,效率低下且泛化能力较差的问题,提出一种基于全卷积残差神经网络模型的自然场景文本检测算法,整个网络是一种端到端的学习方式,训练图片直接回归样本标签,加强网络学习监督指导,提高网络训练速度。本专利技术的技术方案如下:一种基于全本文档来自技高网...

【技术保护点】
1.一种基于全卷积残差网络的自然场景文本检测方法,其特征在于:/n(1)数据获取:文本图像采集,在不同角度摄像头下的预设区域提取自然场景图片,并进行文本位置标签标记,获得训练数据;/n(2)训练:首先对训练数据图片进行预处理,然后图片分批次输入到网络中,进入的特征提取主网络中,通过卷积,池化和激活等操作提取不同层级的图像特征;/n(3)测试:对于所有测试图片进行测试,通过召回率,精确度和综合评价指标共同衡量算法性能优劣,体现模型表达能力,如模型效果不理想,进一步调参再训练;/n(4)上线启用:将算法模型集成到相应的系统中,达到可直接使用的目的,达到复杂场景文本检测的目的。/n

【技术特征摘要】
1.一种基于全卷积残差网络的自然场景文本检测方法,其特征在于:
(1)数据获取:文本图像采集,在不同角度摄像头下的预设区域提取自然场景图片,并进行文本位置标签标记,获得训练数据;
(2)训练:首先对训练数据图片进行预处理,然后图片分批次输入到网络中,进入的特征提取主网络中,通过卷积,池化和激活等操作提取不同层级的图像特征;
(3)测试:对于所有测试图片进行测试,通过召回率,精确度和综合评价指标共同衡量算法性能优劣,体现模型表达能力,如模型效果不理...

【专利技术属性】
技术研发人员:单鼎一
申请(专利权)人:北京航天长峰科技工业集团有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1