一种基于角点检测的视频字幕区域定位方法技术

技术编号:16473637 阅读:35 留言:0更新日期:2017-10-29 01:29
一种基于角点检测的视频字幕区域定位方法,包括:对待定位的视频帧进行角点检测,得到每一帧图片的角点,将角点在水平和竖直方向上进行投影,得到投影直方图,对得到的投影直方图进行优化处理,利用优化处理后的投影直方图对字幕区域进行定位,对整个区域被错误切分为多个部分的细碎区域进行融合,获得最终的文字区域。本发明专利技术有益效果:本发明专利技术与现有技术相比,对视频中字幕区域的定位精确,准确率高,具有优异的效果,尤其是对于新闻视频字幕的定位,本发明专利技术的细碎区域融合可以将错误定位的细碎区域进行融合,使其成为一个整体,消除定位错误,使定位效果更好,更显著。

A video caption localization method based on corner detection

A video caption location method based on corner detection include: corner detection of video frames to locate the corner every frame image, the corner points of the projection in horizontal and vertical direction, and get the projection histogram, to optimize the projection histogram obtained from the positioning of the caption area using the projection histogram after the optimization, the whole area is divided into a plurality of small error area of the fusion, get final text area. The present invention has the beneficial effects: compared with the prior art, the caption in the video positioning accuracy, high accuracy, excellent effect, especially for the positioning of news video caption, fine fusion region of the present invention can be fine positioning error of regional integration, make it become a whole, eliminating location the positioning error, the effect is better, more significant.

【技术实现步骤摘要】
一种基于角点检测的视频字幕区域定位方法
本专利技术涉及图像处理
,具体地说是一种基于角点检测的视频字幕区域定位方法。
技术介绍
随着多媒体数据呈爆炸性增长,文本、图像、语音、视频等各种形式的多媒体信息都将被传入网上,人们正在飞速进入信息化社会。多媒体信息在网络以及通信中的应用也越来越广泛,尤其以视频数据为代表,该类数据成为人们分享信息的重要资源。视频数据以其丰富、直观而具体的信息表达形式成为最重要的信息载体,为人们传递着大量的信息和知识。其中新闻视频作为视频数据中有代表性的一种媒体,在视频资源中占有重要比例,相对于文本新闻,视频新闻生动、直观、易于理解、信息量大,广泛地受到人们的关注。由于新闻视频的特殊性,绝大部分高层语义都在文本字幕中,而音频和图像特征几乎被文本特征所包含,因此对新闻视频中字幕区域的定位提取就尤为重要。由于文本的颜色、大小、字体和位置是可变的,因此很难找到一种通用的方法将其与背景分离。文本位置方法可以分为两大类:基于区域的方法和基于纹理的方法。这些方法各有优缺点,针对不同的情况选用合适的方法才可以有很好的效果。角点作为图像的典型特征,在保留图像图形重要特征的同本文档来自技高网...
一种基于角点检测的视频字幕区域定位方法

【技术保护点】
一种基于角点检测的视频字幕区域定位方法,其特征在于:包括以下步骤:步骤一、对待定位的视频帧进行角点检测,得到每一帧图片的角点,将角点在水平和竖直方向上进行投影,得到投影直方图;步骤二、对步骤二得到的投影直方图进行优化处理,具体方法为:(1)对投影直方图的行进行合并:即将高度为Ry的新闻视频图片分为Ry行,将相邻若干行上的角点数进行加权至其中一行并保留,同时删去此组的其他行,若n为所要合并的行数,合并后共有m组,则

【技术特征摘要】
1.一种基于角点检测的视频字幕区域定位方法,其特征在于:包括以下步骤:步骤一、对待定位的视频帧进行角点检测,得到每一帧图片的角点,将角点在水平和竖直方向上进行投影,得到投影直方图;步骤二、对步骤二得到的投影直方图进行优化处理,具体方法为:(1)对投影直方图的行进行合并:即将高度为Ry的新闻视频图片分为Ry行,将相邻若干行上的角点数进行加权至其中一行并保留,同时删去此组的其他行,若n为所要合并的行数,合并后共有m组,则假设每一行的角点数分别为则合并后的m个行上最终的角点数N(ld)可由公式(1)得到:其中,d=1,2,…m,l为行符号,ld表示第d行;同理,用同样的方法对列进行合并,得到合并后每一列的角点数N(ke),其中,e表示合并后的第e列,k为列符号,ke表示第k列;(2)采用公式(2)对合并后的投影直方图进行相对宽度处理:其中,N(lh)为合并后每一行的相对角点数,Rx为原新闻视频图片的宽度,Wr是一个抑制值;(3)采用公式(3)对投影图进行相对高度处理:其中,N(kw)为合并后每一列的相对角点数,Ry为原新闻视频图片的高度,Wc是一个抑制值;步骤三、利用步骤二优化处理后的投影直方图对字幕区域进行定位,得到定位区域D1,D2,…Ds;步骤四、对整个区域被错误切分为多个部分的细碎区域进行融合;步骤五、获得最终的文字区域。2.根据权利要求1所述的一种基于角点检测的视频字幕区域定位方法,其特征在于:所述步骤三中通过优化处理后的投影直方图对字幕区域进行定位的方法为:(1)设置行阈值t1,定位上下边界:经过优化处理后的的投影直方图的高度为h,每一行投影为l1,l2,…lh,每一行投影的相对角点数为N(l1),N(l2),…N(l...

【专利技术属性】
技术研发人员:霍华吕靖常国沁李宁波
申请(专利权)人:河南科技大学
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1