【技术实现步骤摘要】
基于特征摘要图的视频中的户外场景文本自动获取方法
本专利技术涉及一种数字图像处理方法,确切地说,涉及一种基于特征摘要图的视频中的户外场景文本自动获取方法,属于计算机视觉处理的
技术介绍
过去的几年中,随着数字图像采集装置、智能手机和实用视觉系统及其设备的普及,基于内容的图像理解技术得到越来越多的关注。因为图像/视频中的场景文本具有比较丰富、直接的语义信息线索,因此,场景文本被认为是必须要被检测和识别的重要对象。其中,文本检测、定位、提取和识别是获取文本信息的主要步骤。通常是将文本检测、定位和提取的操作统一称为文本获取。对于文本识别而言,文本获取是非常重要的前提,因为它减少了复杂背景,消除了照明效果,从而使得识别相对简单和容易。然而,由于室内外的不均匀光照,图像/视频的模糊不清,背景复杂,透视变形,颜色多样性,字体复杂和笔划宽度的不同等等多种不利因素,都对视频场景文本的获取产生很大的挑战性和严峻性。目前,国内外的研究人员已经在视频场景文本的获取技术方面研制成功了多种方法。现在,将场景文本的提取分为两个步骤:(1)场景文本的检测定位,(2)场景文本的提取。现有技术的场景文本检测定位方法可分为:基于颜色的、基于边缘/梯度的、基于纹理的和基于笔划的四种不同的场景文本检测方法。其中:基于颜色的场景文本检测:这是一种早就提出并已经用了20余年的传统方法,该方法简单又高效:通常采用基于局部阈值的场景文本检测算法,也有研究人员采用改进尼布拉克Niblack算法中的局部阈值获取方法,使得该方法能够用于一些背景比较简单的场景文本进行快速检测。研究人员还提出使用均值移 ...
【技术保护点】
一种基于特征摘要图的视频中的户外场景文本自动获取方法,其特征在于:该方法包括下列操作步骤:步骤1,获取场景文本的视频帧图像,并基于该视频帧图像的红绿蓝RGB色彩空间生成视频帧特征摘要图:首先在RGB色彩空间上分别提取包括水平方向、垂直方向、45度方向和135度方向的四个卷积图,得到用于表征RGB色彩空间的四个方向特征向量;再将该四个方向特征向量分别进行两两向量的乘积运算,以获得分别代表不同方向视频帧的十个显著图;然后对该不同方向的十个显著图进行融合计算,得到视频帧特征摘要图,作为后续获取视频中的场景文本的视觉表征,并删除背景和噪声干扰,提高识别精准度;步骤2,自动获取场景文本:首先基于该视频帧特征摘要图和RGB色彩空间进行K均值颜色聚类计算,将该视频帧摘要图细分为分别表示背景、前景文字字符、字符轮廓和噪音的四个区域的四类结果;再对该四类结果分别进行连通域分析,删除背景和噪音两个区域,获取最终的场景文本。
【技术特征摘要】
1.一种基于特征摘要图的视频中的户外场景文本自动获取方法,其特征在于:该方法包括下列操作步骤:步骤1,获取场景文本的视频帧图像,并基于该视频帧图像的红绿蓝RGB色彩空间生成视频帧特征摘要图:首先在RGB色彩空间上分别提取包括水平方向、垂直方向、45度方向和135度方向的四个卷积图,得到用于表征RGB色彩空间的四个方向特征向量;再将该四个方向特征向量分别进行两两向量的乘积运算,以获得分别代表不同方向视频帧的十个显著图;然后对该不同方向的十个显著图进行融合计算,得到视频帧特征摘要图,作为后续获取视频中的场景文本的视觉表征,并删除背景和噪声干扰,提高识别精准度;步骤2,自动获取场景文本:首先基于该视频帧特征摘要图和RGB色彩空间进行K均值颜色聚类计算,将该视频帧摘要图细分为分别表示背景、前景文字字符、字符轮廓和噪音的四个区域的四类结果;再对该四类结果分别进行连通域分析,删除背景和噪音两个区域,获取最终的场景文本。2.根据权利要求1所述的方法,其特征在于:所述在RGB色彩空间上分别提取的包括水平方向、垂直方向、45度方向和135度方向的四个卷积图中,水平方向卷积图采用的水平方向卷积核是索贝尔Sobel算子中计算水平方向微分的计算模板:垂直方向卷积图采用的垂直方向卷积核是Sobel算子中计算垂直方向微分的计算模板:45度方向卷积图采用的45度方向卷积核是计算45度方向微分的计算模板:135度方向卷积图采用的135度方向卷积核是计算135度方向微分的计算模板:基于卷积核的卷积图特征提取方法特点是算法简单、运算速度快、有利于工程实现,且提取的卷积特征不容易受到户外场景中的光照变化影响。3.根据权利要求1所述的方法,其特征在于:所述步骤1包括下列操作内容:(11)先分别在红色通道上分别提取水平方向卷积图Rh、垂直方向卷积图Rv、45度方向卷积图Rl和135度方向卷积图Rr,在绿色通道上分别提取水平方向卷积图Gh、垂直方向卷积图Gv、45度方向卷积图Gl和135度方向卷积图Gr,在蓝色通道上分别提取水平方向卷积图Bh、垂直方向卷积图Bv、45度方向卷积图Bl和135度方向卷积图Br;再将上述各个方向卷积图按照RGB色彩空间排列,得到用于表征RGB色彩空间的四个方向特征向量:水平方向特征向量H={Rh,Gh,Bh},垂直方向特征向量V={Rv,Gv,Bv},45度方向特征向量L={Rl,Gl,Bl},135度方向特征向量R={RrGr,Br};(12)将该四个方向特征向量分别进行两两向量的乘积运算,获得代表视频帧的不同方向的十个显著图,以便在保留多个设定方向边缘特征的同时,删除其余方向的背景和噪音干扰,并获取场景文本多种方向的笔划特征,有助于自动提取场景文本;(13)对该不同方向的十个显著图进行融合计算,得到视频帧特征摘要图,为后续获取视频中的场景文本提供视觉表征,并删除背景和噪声干扰,提高场景文本自动获取结果的精准度和完整度。4.根据权利要求3所述的方法,其特征在于:所述步骤(12)包括下列操作内容:(120)按照公式Shh={Rh,Gh,Bh}×{Rh,Gh,Bh}计算水平方向特征向量的自乘之积,得到水平方向显著图Shh,用于保留和强化水平方向的边缘特征,并弱化其他方向边缘特征;(121)按照公式Svv={Rv,Gv,Bv}×{Rv,Gv,Bv}计算垂直方向特征向量的自乘之积,得到垂直方向显著图Svv,用于保留和强化垂直方向的边缘特征,并弱化其他方向边缘特征;(122)按照公式Sll={Rl,Gl,Bl}×{Rl,Gl,Bl}计算45度方向特征向量的自乘之积,得到45度方向显著图Sll,用于保留和强化45度方向的边缘特征,并弱化其他方向边缘特征;(123)按照公式Srr={Rr,Gr,Br}×{Rr,Gr,Br}计算135度方向特征向量的自乘之积,得到135度方向显著图Srr,用于保留和强化135度方向的边缘特征,并弱化其他方向边缘特征;(124)按照公式Shv={Rh,Gh,Bh}×{Rv,Gv,Bv}计算水平与垂直两个方向特征向量的相乘之积,得到水平垂直方向显著图Shv,用于保留和强化水平垂直方向的边缘特征,并弱化其他方向边缘特征;(125)按照公式Shl={Rh,Gh,Bh}×{Rl,Gl,Bl}计算水平与45度两个方向特征向量的相乘之积,得到水平45度方向显著图Shl,用于保留和强化水平45度方向的边缘特征,并弱化其他方向边缘特征;(126)按照公式Shr={Rh,Gh,Bh}×{Rr,Gr,Br}计算水平与135度两个方向特征向量的相乘之积,得到水平135度方向显著图Shr,用于保留和强化水平135度方向的边缘特征,并弱化其他方向边缘特征;(127)按照公式Svl={Rv,Gv,Bv}×{Rl,Gl,Bl}计算垂直与45度两个方向特征向量的相乘之积,得到垂直45度方向显著图Svl,用于保留和强化垂直45度...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。