视频字幕提取方法、装置、设备及存储介质制造方法及图纸

技术编号：40464325 阅读：28 留言：0更新日期：2024-02-22 23:18

本公开提供一种视频字幕提取方法、装置、设备及存储介质，所述方法包括：获取待提取字幕的视频；对所述视频提取多帧图像，对所述多帧图像中每帧图像分别进行文本识别，基于识别到的每帧图像中包含的文本以及每帧图像的时间戳，得到第一字幕序列；所述第一字幕序列包含：携带有时间戳的多个第一语句；对所述视频中的语音进行语音转文本处理，得到第二字幕序列；所述第二字幕序列包含：携带有时间戳的多个第二语句；对所述第二字幕序列进行如下修正处理，得到所述视频的字幕：比较每一对携带相同时间戳的第一语句和第二语句，将经过比较确定出的相似的一对语句中的第二语句替换为第一语句。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及视频处理，尤其涉及视频字幕提取方法、装置、设备及存储介质。

技术介绍

1、视频字幕是指在视频播放过程中，将视频中人物声音以文字形式呈现出来的信息。在一些场景下，需要从视频中提取人物声音转换为视频字幕，然而，已有的视频字幕提取方案提取的字幕质量不高。

技术实现思路

1、为克服相关技术中存在的问题，本公开提供了视频字幕提取方法、装置、设备及存储介质。

2、根据本说明书实施例的第一方面，提供一种视频字幕提取方法，所述方法包括：

3、获取待提取字幕的视频；

4、对所述视频提取多帧图像，对所述多帧图像中每帧图像分别进行文本识别，基于识别到的每帧图像中包含的文本以及每帧图像的时间戳，得到第一字幕序列；其中，所述第一字幕序列包含：携带有时间戳的多个第一语句；

5、对所述视频中的语音进行语音转文本处理，得到第二字幕序列；其中，所述第二字幕序列包含：携带有时间戳的多个第二语句；

6、对所述第二字幕序列进行如下修正处理，得到所述视频的字幕：...

【技术保护点】

1.一种视频字幕提取方法，所述方法包括：

2.根据权利要求1所述的方法，所述比较每一对携带相同时间戳的第一语句和第二语句，将经过比较确定出的相似的一对语句中的第二语句替换为第一语句，包括：

3.根据权利要求1或2所述的方法，所述对所述多帧图像中每帧图像分别进行文本识别，包括：

4.根据权利要求3所述的方法，所述获取所述多帧图像中每帧图像的字幕位置区域，包括：

5.根据权利要求4所述的方法，所述识别出所述每帧图像的至少一个文本框中的无效文本框并去除，包括：

6.根据权利要求2所述的方法，所述多帧图像为按时间先后顺序排列的多帧图像；...

【技术特征摘要】

1.一种视频字幕提取方法，所述方法包括：

3.根据权利要求1或2所述的方法，所述对所述多帧图像中每帧图像分别进行文本识别，包括：

4.根据权利要求3所述的方法，所述获取所述多帧图像中每帧图像的字幕位置区域，包括：

5.根据权利要求4所述的方法，所述识别出所述每帧图像的至少一个文本框中的无效文本框并去除，包括：

6.根据权利要求2所述的方法，所述多帧图像为按时间先后顺序排列的多帧图像；所...

【专利技术属性】
技术研发人员：王荣生，刘传宝，苑爱泉，
申请(专利权)人：拉扎斯网络科技上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人