一种轮询视频文字定位方法及系统技术方案

技术编号:31749317 阅读:29 留言:0更新日期:2022-01-05 16:30
本发明专利技术属于计算机视觉技术领域,提供了一种轮询视频文字定位方法及系统,首先提取轮询视频关键帧图像,对关键帧图像进行预处理,得到LAB图像和灰度图像;然后将LAB图像中的像素点划分到若干个超像素,结合灰度图像,筛选构成候选文字区域的超像素;接着对构成候选文字区域的超像素进行分类;最后对灰度图像进行角点检测,统计每类包含的角点数,选择所含角点数最多的类作为视频画面中的文字区域,提高了轮询视频中文字定位速度和准确度。轮询视频中文字定位速度和准确度。轮询视频中文字定位速度和准确度。

【技术实现步骤摘要】
一种轮询视频文字定位方法及系统


[0001]本专利技术属于计算机视觉
,尤其涉及一种轮询视频文字定位方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
[0003]会议轮询视频由参加会议的各地区分会场以固定时长依次上送监控画面构成,包含所有与会分会场的实时会议信息。根据视频会议中对于分会场的与会规范,各分会场需要在会议室内设置挡板或背景板,并按与会规范要求在挡板或背景板上印刷规定字体格式的文字,作为检查各分会场与会情况的重要信息。而对于视频会议轮询画面中文字区域的记录核查,若依赖人工判断,长时间占用后台值机人员,难以提高工作效率。
[0004]使用计算机对轮询视频的关键帧进行数字图像处理,可以定位并截取上送监控画面中的文字区域,协助后台值机人员检查各分会场与会情况,有利于减轻后台值机人员的工作负担,提高工作效率。
[0005]近年来,研究人员研究了使用数字图像处理算法定位轮询视频文字的方法,例如,申请号为CN201710027704.1,专利技术人为刘明本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种轮询视频文字定位方法,其特征在于,包括:获取轮询视频,并提取轮询视频关键帧图像;对关键帧图像进行预处理,得到LAB图像和灰度图像;将LAB图像中的像素点划分到若干个超像素;结合灰度图像,筛选构成候选文字区域的超像素;对构成候选文字区域的超像素进行分类;对灰度图像进行角点检测,统计每类包含的角点数,选择所含角点数最多的类作为视频画面中的文字区域。2.如权利要求1所述的一种轮询视频文字定位方法,其特征在于,所述提取轮询视频关键帧图像的具体步骤为:计算每帧图像的帧差距离,并与设定阈值比较,当帧差距离大于阈值时,判定为关键帧图像,否则,判定为非关键帧图像。3.如权利要求1所述的一种轮询视频文字定位方法,其特征在于,所述预处理包括:对所述关键帧图像进行形态学膨胀运算,得到膨胀处理后的图像;将膨胀处理后的图像从RGB颜色空间下转换至LAB颜色空间,得到LAB图像;对所述关键帧图像进行灰度处理,得到灰度图像。4.如权利要求1所述的一种轮询视频文字定位方法,其特征在于,所述将LAB图像中的像素点划分到若干个超像素的具体步骤为:将LAB图像中的像素点划分到若干相同尺寸的初始超像素;计算每个超像素的聚类中心;对于LAB图像中一个像素点,在该像素点邻域包含的聚类中心中查找距离最近的聚类中心,并将该聚类中心所对应的超像素作为新的该像素点所属的超像素,遍历LAB图像中的所有像素,更新每个像素点所属的超像素;判断迭代是否结束,若未结束,返回计算新的超像素的聚类中心;否则,将所含像素点数目小于阈值的超像素并入与其边界重合最多的其他超像素中,更新LAB图像中每个像素点所属的超像素。5.如权利要求1所述的一种轮询视频文字定位方法,其特征在于,所述筛选构成候选文字区域的超像素的具体步骤为:计算每个超像素在所述灰度图像中对应的灰度直方图,并将直方图中相邻多个灰度的频数平均值作为中间灰度的频数,得到平滑后的灰度直方图;将平滑后的灰度直方...

【专利技术属性】
技术研发人员:何子亨王朔左修洋王雨晨孙丽丽张延童刘鸿雁车四四刘方舟朱立楠张中行
申请(专利权)人:国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1