字幕提取方法、装置、计算机设备、可读存储介质及产品制造方法及图纸

技术编号：33888916 阅读：26 留言：0更新日期：2022-06-22 17:23

本申请实施例公开了一种字幕提取方法、装置、计算机设备、可读存储介质及产品，可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。本申请实施例中字幕提取装置获取待处理视频；对所述待处理视频进行分帧处理，以得到多帧图片序列；对每帧图片进行文字检测处理，以识别所述每帧图片中的文字检测框；对每帧图片中的文字检测框进行时间上的轨迹跟随，得到所述待处理视频的文字检测框跟随轨迹集合；根据所述待处理视频的文字检测框跟随轨迹集合，确定参考字幕区域；基于所述参考字幕区域提取所述待处理视频的字幕。提高了字幕提取的准确性。性。性。

全部详细技术资料下载

【技术实现步骤摘要】
字幕提取方法、装置、计算机设备、可读存储介质及产品

[0001]本申请涉及图像处理
，具体涉及一种字幕提取方法、装置、计算机设备、可读存储介质及产品。

技术介绍

[0002]现有的视频字幕提取方法很多不是对输入视频自动化的提取字幕，而是输入视频中字幕区域的图片，并从这些字幕图片中提取字幕。
[0003]现有的视频字幕提取方法很多采用传统的计算机视觉的方法(比如，边缘检测，图像滤波)，视频文字检测和识别步骤采用的是传统的OCR，传统的OCR技术不能处理背景复杂的互联网视频中的文字，导致之前的字幕检测和字幕跟随方法针对的是简单视频，即视频中的除了字幕以外，没有其它文字或者其它文字很少。随着互联网视频的不断增多，视频中的文字种类也很多，字幕只是视频中的文字的一部分，视频中可能会出现很多其他非字幕的文字区域。对于这些包含很多文字的复杂视频，之前的方法无法准确提取并跟随到字幕。

技术实现思路

[0004]本申请实施例提供一种字幕提取方法、装置、计算机设备、可读存储介质及产品，可以提高字幕提取的效率。/>[0005]一种本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种字幕提取方法，其特征在于，包括：获取待处理视频；对所述待处理视频进行分帧处理，以得到多帧图片序列；对每帧图片进行文字检测处理，以识别所述每帧图片中的文字检测框；对每帧图片中的文字检测框进行时间上的轨迹跟随，得到所述待处理视频的文字检测框跟随轨迹集合；根据所述待处理视频的文字检测框跟随轨迹集合，确定参考字幕区域；基于所述参考字幕区域提取所述待处理视频的字幕。2.根据权利要求1所述的字幕提取方法，其特征在于，所述对每帧图片中的文字检测框进行时间上的轨迹跟随，得到所述待处理视频的文字检测框跟随轨迹集合，包括：对每帧图片中的文字检测框进行时间上的轨迹跟随，以得到所述文字检测框的跟随轨迹集合；根据所述文字检测框的跟随轨迹集合，生成所述待处理视频的文字检测框跟随轨迹集合。3.根据权利要求2所述的字幕提取方法，其特征在于，所述对每帧图片中的文字检测框进行时间上的轨迹跟随，以得到所述文字检测框的跟随轨迹集合包括：获取每相邻帧图片中文字检测框的文字编辑距离，以及所述相邻帧图片中每帧图片的对应的文字检测框的坐标信息；根据所述坐标信息与所述文字编辑距离，生成所述文字检测框的跟随轨迹集合。4.根据权利要求3所述的字幕提取方法，其特征在于，所述根据所述坐标信息与所述文字编辑距离，生成所述文字检测框的跟随轨迹集合包括：根据所述坐标信息确定所述相邻帧图片中所述文字检测框的面积信息；若根据所述面积信息确定所述相邻帧图片中的文字检测框满足第一匹配条件，且根据所述文字编辑距离确定所述相邻帧图片中的文字检测框满足第二匹配条件，则将所述相邻帧图片中后一帧图片的文字检测框添加至前一帧图片的文字检测框对应的跟随轨迹集合中。5.根据权利要求4所述的字幕提取方法，其特征在于，所述面积信息包括交集面积与并集面积，所述根据所述面积信息确定所述相邻帧图片中的文字检测框满足第一匹配条件包括：获取所述相邻帧图片中文字检测框的交集面积与并集面积；根据所述交集面积与并集面积计算所述相邻帧图片中文字检测框的并交比；若所述文字检测框的并交比大于或等于预设并交比，则确定所述文字检测框满足第一匹配条件。6.根据权利要求4所述的字幕提取方法，其特征在于，所述根据所述文字编辑距离确定所述相邻帧图片中的文字检测框满足第二匹配条件包括：若所述文字编辑距离小于或等于预设编辑距离，则确定所述文字检测框满足第二匹配条件。7.根据权利要求3所述的字幕提取方法，其特征在于，所述获取所述相邻帧图片中文字检测框的文字编辑距离包括：
采用预设文字识别算法识别相邻帧图片中的文字检测框内的文字内容；根据所述文字内容计算所述相邻帧图片中的文字检测框内的文字内容之间的文字编辑距离。8.根据权利要求4所述的字幕提取方法，其特征在于，所述方法还包括：若根据所述面积信息确定所述相邻帧图片中的文字检测框不满足第一匹配条件，和/或根据所述文字编辑距离确定所述相邻帧...

【专利技术属性】
技术研发人员：王洪松，黄珊，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人