音视频剪辑方法和装置制造方法及图纸

技术编号：31842893 阅读：35 留言：0更新日期：2022-01-12 13:23

本公开提供了音视频剪辑方法和装置，涉及多媒体技术领域，尤其涉及剪辑技术领域。具体实现方案为：获取原始音视频片段和对应的脚本句子集合；从原始音视频片段中语音识别出字幕句子集合；对于脚本句子集合中的每个脚本句子，从字幕句子集合召回与该脚本句子相似度高于第一阈值的目标句子；使用每个目标句子的字幕识别的文本对齐时间对原始音视频片段按顺序进行剪辑拼接，生成中间音视频片段；根据每个目标句子的字幕识别的文本对齐时间将每个目标句子替换为对应的脚本句子，并按照对齐时间把脚本句子与中间音视频片段进行组合，得到剪辑音视频片段。该实施方式实现了快速、准确地音视频剪辑。地音视频剪辑。地音视频剪辑。

全部详细技术资料下载

【技术实现步骤摘要】
音视频剪辑方法和装置

[0001]本公开涉及多媒体
，尤其涉及剪辑
，具体为一种音视频剪辑方法和装置。

技术介绍

[0002]随着用户需求与媒体技术的发展，视频的数量也呈指数级的爆炸增长，对视频进行剪辑也成为人们关注的视频处理方式。视频剪辑技术是一种将待剪辑对象通过剪辑的方式合成一段剪辑视频的视频处理方式，常应用于短视频制作、视频集锦等视频剪辑场景。
[0003]在常见的视频剪辑过程中，视频录制者通常会撰写视频脚本(即视频内容逐字稿)，用于视频录制中的提词录制。录制过程中，录制者常会出现卡顿、念错字、念错句、念口癖词、重复念稿等行为，这些行为通常会在后期制作中通过人工删除。

技术实现思路

[0004]本公开提供了一种音视频剪辑方法、装置、设备、存储介质以及计算机程序产品。
[0005]根据本公开的第一方面，提供了一种音视频剪辑方法，包括：获取原始音视频片段和对应的脚本句子集合；从所述原始音视频片段中语音识别出字幕句子集合；对于所述脚本句子集合中的每个脚本句子，从所述字幕句子集合召回...

【技术保护点】

【技术特征摘要】
1.一种音视频剪辑方法，包括：获取原始音视频片段和对应的脚本句子集合；从所述原始音视频片段中语音识别出字幕句子集合；对于所述脚本句子集合中的每个脚本句子，从所述字幕句子集合召回与该脚本句子相似度高于第一阈值的目标句子；使用每个目标句子的字幕识别的文本对齐时间对所述原始音视频片段按顺序进行剪辑拼接，生成中间音视频片段；根据每个目标句子的字幕识别的文本对齐时间将每个目标句子替换为对应的脚本句子，并按照所述对齐时间把脚本句子与中间音视频片段进行组合，得到剪辑音视频片段。2.根据权利要求1所述的方法，其中，所述方法还包括：对于所述脚本句子集合中的每个脚本句子，从所述字幕句子集合中召回与该脚本句子相似度高于第二阈值的候选句子，所述第二阈值低于所述第一阈值，并将除目标句子之外的候选句子根据字幕识别的文本对齐时间进行剪辑，形成候补音视频片段供用户选择。3.根据权利要求1所述的方法，其中，所述方法还包括：根据所述字幕句子集合中各字幕句子的时间间隔从所述剪辑音视频片段中检测出卡顿片段；从所述剪辑音视频片段中删除所述卡顿片段。4.根据权利要求1所述的方法，其中，所述方法还包括：对于所述脚本句子集合中的每个脚本句子，若无法从所述字幕句子集合中召回与该脚本句子相似度高于第一阈值的目标句子，则输出该脚本句子被遗漏的提示信息。5.根据权利要求4所述的方法，其中，所述方法还包括：响应于接收到用户提交的被遗漏的音视频片段，将所述被遗漏的音视频片段插入到所述剪辑音视频片段中。6.根据权利要求1
‑
5中任一项所述的方法，其中，所述从所述字幕句子集合召回与该脚本句子相似度高于第一阈值的目标句子包括：计算该脚本句子与所述字幕句子集合中各字幕句子的编辑距离；将编辑距离小于预设值的字幕句子确定为目标句子。7.一种音视频剪辑装置，包括：获取单元，被配置成获取原始音视频片段和对应的脚本句子集合；识别单元，被配置成从所述原始音视频片段中语音识别出字幕句子集合；召回单元，被配置成对于所述脚本句子集合中的每个脚本句子，从所述字幕句子集合召回与该脚本句子相似度高于第一阈值的目标句子；拼接单元，被配置成使用每个目标句子的字幕识别的文本对齐时间对所述原始音视频片段按顺序进行剪...

【专利技术属性】
技术研发人员：曹溪语，吴悦，奉伟，郑程，单文睿，陈进生，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人