【技术实现步骤摘要】
一种基于全卷积网络的场景图像文本建议方法
本专利技术涉及图像文本建议领域,尤其是涉及了一种基于全卷积网络的场景图像文本建议方法。
技术介绍
自然场景图像中文字的检测和识别,对于基于文字内容的图像分析具有重要的作用,对人工智能的发展也有重要的理论意义。图像文本的检测和识别与人们的日常生活、工作息息相关,它可以应用到身份证件的信息读取和查询,多媒体信息服务,车辆车牌的跟踪与定位,基于视觉的汽车导航、智能机器人等众多场合,给人们的生活带来了方便。对象提案技术已经成为通过生成候选类独立对象位置和范围,减少图像中对象位置的搜索空间的有效方法。这种通用对象提案方法通常用于检测单体对象,并且不适用于旨在检测不相交的部分对象(字符或文本笔画)的文本检测。先前的方法在分割图像时不太理想,文本提案算法的性能低下,因此,如何提高性能和效率,是研究人员关注的重点。本专利技术提出了一种基于全卷积网络的场景图像文本建议方法,先文本建议阶段将图像分解为区域,输入图像的初始分割,从中获得一组连接分量,接着通过几个自下而上的聚集过程创建文本假设,再利用全卷积网络(FCN)预测和估计图像,最后使用F ...
【技术保护点】
一种基于全卷积网络的场景图像文本建议方法,其特征在于,主要包括图像区域分解(一);创建文本分组假设(二);全卷积网络(FCN)预测和估计图像(三);文本假设排名和优化(四)。
【技术特征摘要】
1.一种基于全卷积网络的场景图像文本建议方法,其特征在于,主要包括图像区域分解(一);创建文本分组假设(二);全卷积网络(FCN)预测和估计图像(三);文本假设排名和优化(四)。2.基于权利要求书1所述的图像区域分解(一),其特征在于,文本建议阶段将图像分解为区域,输入图像的初始分割,从中获得一组连接分量;FCN对图像进行像素级的分类,从而解决了语义级别的图像分割。3.基于权利要求书2所述的区域分解,其特征在于,基于最稳定极值区域算法,目的在于检测组成部分,这将影响后续的文本分类;接着,根据相似的线索,如强度、颜色和笔画宽度,分组过程建立最稳定极值区域初始设定分组的层次。4.基于权利要求书1所述的创建文本分组假设(二),其特征在于,通过几个自下而上的聚集过程创建文本假设;首先,基于沿着层次结构,以增量方式计算出特征,各组分类为文本或非文本。5.基于权利要求书4所述的文本提案,其特征在于,一旦非文本分组被过滤出来,剩下的分组基于来自感知组织原理的文本结构质量得分和特定分组的感知意义的概念得分,形成文本提案。6.基于权利要求书1所述的全卷积网络(FCN)预测和估计图像(三),其特征在于,FCN的目的在于提供像素级预测;FCN中的每个层计算相对空间坐标的本地操作;由于没有完全连接的层,可以在可变尺寸图像上使用FCN,并产生相应输入尺寸的输出,保留对于文本检测任务至关重要的图像的粗略空间信息;因此使用FCN执行...
【专利技术属性】
技术研发人员:夏春秋,
申请(专利权)人:深圳市唯特视科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。