【技术实现步骤摘要】
本公开涉及视频处理,尤其涉及视频字幕提取方法、装置、设备及存储介质。
技术介绍
1、视频字幕是指在视频播放过程中,将视频中人物声音以文字形式呈现出来的信息。在一些场景下,需要从视频中提取人物声音转换为视频字幕,然而,已有的视频字幕提取方案提取的字幕质量不高。
技术实现思路
1、为克服相关技术中存在的问题,本公开提供了视频字幕提取方法、装置、设备及存储介质。
2、根据本说明书实施例的第一方面,提供一种视频字幕提取方法,所述方法包括:
3、获取待提取字幕的视频;
4、对所述视频提取多帧图像,对所述多帧图像中每帧图像分别进行文本识别,基于识别到的每帧图像中包含的文本以及每帧图像的时间戳,得到第一字幕序列;其中,所述第一字幕序列包含:携带有时间戳的多个第一语句;
5、对所述视频中的语音进行语音转文本处理,得到第二字幕序列;其中,所述第二字幕序列包含:携带有时间戳的多个第二语句;
6、对所述第二字幕序列进行如下修正处理,得到所述视频的字幕:
...【技术保护点】
1.一种视频字幕提取方法,所述方法包括:
2.根据权利要求1所述的方法,所述比较每一对携带相同时间戳的第一语句和第二语句,将经过比较确定出的相似的一对语句中的第二语句替换为第一语句,包括:
3.根据权利要求1或2所述的方法,所述对所述多帧图像中每帧图像分别进行文本识别,包括:
4.根据权利要求3所述的方法,所述获取所述多帧图像中每帧图像的字幕位置区域,包括:
5.根据权利要求4所述的方法,所述识别出所述每帧图像的至少一个文本框中的无效文本框并去除,包括:
6.根据权利要求2所述的方法,所述多帧图像为按时间先后
...【技术特征摘要】
1.一种视频字幕提取方法,所述方法包括:
2.根据权利要求1所述的方法,所述比较每一对携带相同时间戳的第一语句和第二语句,将经过比较确定出的相似的一对语句中的第二语句替换为第一语句,包括:
3.根据权利要求1或2所述的方法,所述对所述多帧图像中每帧图像分别进行文本识别,包括:
4.根据权利要求3所述的方法,所述获取所述多帧图像中每帧图像的字幕位置区域,包括:
5.根据权利要求4所述的方法,所述识别出所述每帧图像的至少一个文本框中的无效文本框并去除,包括:
6.根据权利要求2所述的方法,所述多帧图像为按时间先后顺序排列的多帧图像;所...
【专利技术属性】
技术研发人员:王荣生,刘传宝,苑爱泉,
申请(专利权)人:拉扎斯网络科技上海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。