A video clip method is disclosed. The video clipping method includes: obtaining a first audio file and a second audio file; identifying the first audio file and the second audio file, and generating a first text and a second text, the first text including a first time marker, the second text including a second time marker; and according to the first text and the second audio file The second text generates a third text including a third time mark, cuts the first audio file and the second audio file to generate the third audio file. The invention can convert audio files into text and then clip, so that the editing efficiency can be improved.
【技术实现步骤摘要】
一种视频剪辑方法及装置
本专利技术涉及视频处理技术,更具体地,涉及视频剪辑方法及装置。
技术介绍
在传统的视频剪辑流程中,对于对话场景的镜头剪辑,需要多次重复观看多个机位拍摄的对话场景,基本熟悉对话内容之后,再针对内容进行合理剪辑。这个工艺环节耗时严重,剪辑人员需要消耗大量的时间和精力来完成。现有的最接近的方案,是在传统的剪辑流程中,后期剪辑师需要向拍摄方索取对话场景台词脚本,然后按照脚本去观看素材,辅助完成剪辑。但是,很多情况下,对话是随机完成的,事先并没有台词脚本。或者,后期剪辑师无法获得台词脚本。抑或,即便获得台词脚本,该台词脚本也是设计阶段的文本,和实际的拍摄素材的对应依旧很困难。再加上实拍时,人物的对话与台词脚本未必精确对应。这就导致后期剪辑师在处理对话剪辑时,基本没有参考内容。
技术实现思路
有鉴于此,本申请提供一种视频剪辑方法及装置,用于解决后期剪辑师在处理对话剪辑时,基本没有参考内容的问题。根据本专利技术的第一方面,提供一种视频剪辑方法,包括:获取第一音频文件和第二音频文件;识别所述第一音频文件和所述第二音频文件,并生成第一文本和第二文本,所述第一文本包括第一时间标记,所述第二文本包括第二时间标记;根据所述第一文本和所述第二文本生成第三文本,所述第三文本包括第三时间标记,剪切所述第一音频文件和所述第二音频文件,以生成第三音频文件,其中,所述第一文本包括多个第一文本段,所述第一时间标记包括对应于所述多个第一文本段的多个时间信息,所述第二文本包括多个第二文本段,所述第二时间标记包括对应于所述多个第二文本段的多个时间信息,所述第三文本包括多个第三文本 ...
【技术保护点】
1.一种视频剪辑方法,包括:获取第一音频文件和第二音频文件;识别所述第一音频文件和所述第二音频文件,并生成第一文本和第二文本,所述第一文本包括第一时间标记,所述第二文本包括第二时间标记;根据所述第一文本和所述第二文本生成第三文本,所述第三文本包括第三时间标记,剪切所述第一音频文件和所述第二音频文件,以生成第三音频文件,其中,所述第一文本包括多个第一文本段,所述第一时间标记包括对应于所述多个第一文本段的多个时间信息,所述第二文本包括多个第二文本段,所述第二时间标记包括对应于所述多个第二文本段的多个时间信息,所述第三文本包括多个第三文本段,所述第三时间标记包括对应于所述多个第三文本段的多个时间信息,所述多个第三文本段由所述多个第一文本段和所述多个第二文本段中的一个或多个构成,所述第三时间标记根据所述多个第三文本段和所述多个第一文本段、所述多个第二文本段在内容上的对应关系生成。
【技术特征摘要】
1.一种视频剪辑方法,包括:获取第一音频文件和第二音频文件;识别所述第一音频文件和所述第二音频文件,并生成第一文本和第二文本,所述第一文本包括第一时间标记,所述第二文本包括第二时间标记;根据所述第一文本和所述第二文本生成第三文本,所述第三文本包括第三时间标记,剪切所述第一音频文件和所述第二音频文件,以生成第三音频文件,其中,所述第一文本包括多个第一文本段,所述第一时间标记包括对应于所述多个第一文本段的多个时间信息,所述第二文本包括多个第二文本段,所述第二时间标记包括对应于所述多个第二文本段的多个时间信息,所述第三文本包括多个第三文本段,所述第三时间标记包括对应于所述多个第三文本段的多个时间信息,所述多个第三文本段由所述多个第一文本段和所述多个第二文本段中的一个或多个构成,所述第三时间标记根据所述多个第三文本段和所述多个第一文本段、所述多个第二文本段在内容上的对应关系生成。2.根据权利要求1所述的视频剪辑方法,其中,所述第一音频文件根据A机位拍摄视频获得,所述第二音频文件根据B机位拍摄视频获得。3.根据权利要求2所述的视频剪辑方法,还包括:以所述第三音频文件替换所述第一音频文件或所述第二音频文件,得到新的视频,其中,所述第一音频文件或所述第二音频文件为视频的音频文件。4.根据权利要求1所述的视频剪辑方法,其中,所述剪切所述第一音频文件和所述第二音频文件,以生成第三音频文件包括:根据所述对应关系从所述第一音频文件和/或所述第二音频文件中切割出多个音频片段;以及将所述多个音频片段组合成所述第三音频文件。5.根据权利要求1所述的视频剪辑方法,还包括:格式转换模块,在所述识别所述第一音频文件和所述第二音频文件的步骤之前,将所述第一音频文件和所述第二音频文件从一种音频格式转换成另一种音频格式。6.根据权利要求1至5任一项所述的视频剪辑方法,所述第一时...
【专利技术属性】
技术研发人员:李景颉,
申请(专利权)人:北京秀眼科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。