一种视频剪辑方法及装置制造方法及图纸

技术编号:18662933 阅读:30 留言:0更新日期:2018-08-11 16:34
公开了一种视频剪辑方法。该视频剪辑方法包括:获取第一音频文件和第二音频文件;识别所述第一音频文件和所述第二音频文件,并生成第一文本和第二文本,所述第一文本包括第一时间标记,所述第二文本包括第二时间标记;根据所述第一文本和所述第二文本生成第三文本,所述第三文本包括第三时间标记,剪切所述第一音频文件和所述第二音频文件,以生成第三音频文件。本发明专利技术将音频文件转换成文本后进行剪辑,能够提高剪辑效率。

Video clipping method and device

A video clip method is disclosed. The video clipping method includes: obtaining a first audio file and a second audio file; identifying the first audio file and the second audio file, and generating a first text and a second text, the first text including a first time marker, the second text including a second time marker; and according to the first text and the second audio file The second text generates a third text including a third time mark, cuts the first audio file and the second audio file to generate the third audio file. The invention can convert audio files into text and then clip, so that the editing efficiency can be improved.

【技术实现步骤摘要】
一种视频剪辑方法及装置
本专利技术涉及视频处理技术,更具体地,涉及视频剪辑方法及装置。
技术介绍
在传统的视频剪辑流程中,对于对话场景的镜头剪辑,需要多次重复观看多个机位拍摄的对话场景,基本熟悉对话内容之后,再针对内容进行合理剪辑。这个工艺环节耗时严重,剪辑人员需要消耗大量的时间和精力来完成。现有的最接近的方案,是在传统的剪辑流程中,后期剪辑师需要向拍摄方索取对话场景台词脚本,然后按照脚本去观看素材,辅助完成剪辑。但是,很多情况下,对话是随机完成的,事先并没有台词脚本。或者,后期剪辑师无法获得台词脚本。抑或,即便获得台词脚本,该台词脚本也是设计阶段的文本,和实际的拍摄素材的对应依旧很困难。再加上实拍时,人物的对话与台词脚本未必精确对应。这就导致后期剪辑师在处理对话剪辑时,基本没有参考内容。
技术实现思路
有鉴于此,本申请提供一种视频剪辑方法及装置,用于解决后期剪辑师在处理对话剪辑时,基本没有参考内容的问题。根据本专利技术的第一方面,提供一种视频剪辑方法,包括:获取第一音频文件和第二音频文件;识别所述第一音频文件和所述第二音频文件,并生成第一文本和第二文本,所述第一文本包括第一时间标记,所述第二文本包括第二时间标记;根据所述第一文本和所述第二文本生成第三文本,所述第三文本包括第三时间标记,剪切所述第一音频文件和所述第二音频文件,以生成第三音频文件,其中,所述第一文本包括多个第一文本段,所述第一时间标记包括对应于所述多个第一文本段的多个时间信息,所述第二文本包括多个第二文本段,所述第二时间标记包括对应于所述多个第二文本段的多个时间信息,所述第三文本包括多个第三文本段,所述第三时间标记包括对应于所述多个第三文本段的多个时间信息,所述多个第三文本段由所述多个第一文本段和所述多个第二文本段中的一个或多个构成,所述第三时间标记根据所述多个第三文本段和所述多个第一文本段、所述多个第二文本段在内容上的对应关系生成。优选地,所述第一音频文件根据A机位拍摄视频获得,所述第二音频文件根据B机位拍摄视频获得。优选地,还包括:以所述第三音频文件替换所述第一音频文件或第二音频文件,以得到新的视频,其中,所述第一音频文件或所述第二音频文件为视频的音频文件。优选地,所述剪切所述第一音频文件和所述第二音频文件,以生成第三音频文件包括:根据所述对应关系从所述第一音频文件和/或所述第二音频文件中切割出多个音频片段;以及将所述多个音频片段组合成所述第三音频文件。优选地,还包括:格式转换模块,在所述识别所述第一音频文件和所述第二音频文件的步骤之前,将所述第一音频文件和所述第二音频文件从一种音频格式转换成另一种音频格式。优选地,所述第一时间标记、所述第二时间标记和所述第三时间标记至少包括下述列表中的一种信息:开始时间和结束时间,表示相应的文本段的开始和结束时间;持续时间,表示相应的文本段的时间长度。根据本专利技术的第二方面,提供一种视频剪辑装置,包括:音频获取模块,用于获取第一音频文件和第二音频文件;语音识别模块,用于识别所述第一音频文件和所述第二音频文件,并生成第一文本和第二文本,所述第一文本包括第一时间标记,所述第二文本包括第二时间标记;文本剪辑模块,用于生成第三文本,所述第三文本包括第三时间标记;音频剪切模块,用于根据所述第三文本剪切所述第一音频文件和所述第二音频文件,并生成第三音频文件,其中,所述第一文本包括多个第一文本段,所述第一时间标记包括对应于所述多个第一文本段的多个时间信息,所述第二文本包括多个第二文本段,所述第二时间标记包括对应于所述多个第二文本段的多个时间信息,所述第三文本包括多个第三文本段,所述第三时间标记包括对应于所述多个第三文本段的多个时间信息,所述多个第三文本段由所述多个第一文本段和所述多个第二文本段中的一个或多个构成,所述第三时间标记根据所述多个第三文本段和所述多个第一文本段、所述多个第二文本段在内容上的对应关系生成。优选地,所述音频获取模块根据A机位拍摄视频获得所述第一音频文件,根据B机位拍摄视频获得所述第二音频文件。优选地,还包括:音频替换模块,用于以所述第三音频文件替换所述第一音频文件或第二音频文件,以得到新的视频,其中,所述第一音频文件或所述第二音频文件为视频的音频文件。优选地,所述音频剪切模块包括:剪切单元,用于根据所述对应关系和所述第三标记从所述第一音频文件和/或所述第二音频文件中切割出多个音频片段;合成单元,用于将所述多个音频片段组合成所述第三音频文件。本专利技术提供的实施例将对音频剪辑转换为对文本的剪辑,由于剪辑师阅读文字内容的速度,要远远快于翻看视频的速度。所以,剪辑师可以基于本专利技术,直接对识别文本进行剪辑,进而将对文本的剪辑操作映射为对音频或视频的剪辑操作后,剪辑效率得到了大幅提高。附图说明通过参照以下附图对本专利技术实施例的描述,本专利技术的上述以及其它目的、特征和优点将更为清楚,在附图中:图1是本专利技术实施例的视频剪辑方法的示意流程图;图2a-2b是根据本专利技术实施例基于A和B机位视频生成新视频的示例;图3是本专利技术实施例的视频剪辑装置的示意性结构图。具体实施方式以下将参照附图更详细地描述本专利技术。在各个附图中,相同的元件采用类似的附图标记来表示。为了清楚起见,附图中的各个部分没有按比例绘制。此外,可能未示出某些公知的部分。术语解释:语音识别:指利用计算机软件,对输入的音频文件中的人声进行识别,转换为文字内容。视频制作:指使用专用的视频制作软件,把使用摄影器材拍摄得到的视频素材进行剪辑、加工、调色、配音、添加字幕和特效等处理,得到最终成片的过程。文件格式:指视频或音频数据按照一定的压缩格式进行压缩后,再按照特定的文件格式存储为文件。常用的视频文件格式包括:avi,mp4,wmv,rmvb,mov,flv,mxf,vob,mpeg等,常用的音频文件格式包括wav,mp3,wma,ac3等。剪辑:指使用专用的视频编辑软件,对拍摄的视频素材进行片段截取、位置排列、播放速度调整、片段衔接效果调整等处理,生成一个初级样片的过程。图1是本专利技术实施例的视频剪辑方法的示意流程图。具体包括以下步骤。在步骤S100中,获取第一音频文件和第二音频文件。在步骤中,从音频素材和/或视频素材中获得第一音频文件和第二音频文件。当从视频素材获取相应的音频文件时,需要对视频素材进行解码,以分离出音频流,并将分离出的音频流转换为特定格式的音频文件,例如wav,mp3,wma,ac3格式的音频文件。在步骤S200中,识别第一音频文件和第二音频文件,并生成第一文本和第二文本。在本步骤中,对第一音频文件和第二音频文件进行语音识别,根据识别结果生成第一文本和第二文本,第一文本包括第一时间标记,第二文本包括第二时间标记,第一时间标记和第二时间标记用于表示相应文本内容在相应的音频文件中的时间信息,例如,开始时间和结束时间,或持续时间等信息。第一文本包括多个第一文本段,第一时间标记包括对应于多个第一文本段的多个时间信息,第二文本包括多个第二文本段,第二时间标记包括对应于多个第二文本段的多个时间信息。在步骤S300中,生成第三文本。在本步骤中,根据第一文本和第二文本生成第三文本。第三文本包括多个第三文本段以及第三时间标记,第三时间标记表示相应文本在第三文本中的时间本文档来自技高网...

【技术保护点】
1.一种视频剪辑方法,包括:获取第一音频文件和第二音频文件;识别所述第一音频文件和所述第二音频文件,并生成第一文本和第二文本,所述第一文本包括第一时间标记,所述第二文本包括第二时间标记;根据所述第一文本和所述第二文本生成第三文本,所述第三文本包括第三时间标记,剪切所述第一音频文件和所述第二音频文件,以生成第三音频文件,其中,所述第一文本包括多个第一文本段,所述第一时间标记包括对应于所述多个第一文本段的多个时间信息,所述第二文本包括多个第二文本段,所述第二时间标记包括对应于所述多个第二文本段的多个时间信息,所述第三文本包括多个第三文本段,所述第三时间标记包括对应于所述多个第三文本段的多个时间信息,所述多个第三文本段由所述多个第一文本段和所述多个第二文本段中的一个或多个构成,所述第三时间标记根据所述多个第三文本段和所述多个第一文本段、所述多个第二文本段在内容上的对应关系生成。

【技术特征摘要】
1.一种视频剪辑方法,包括:获取第一音频文件和第二音频文件;识别所述第一音频文件和所述第二音频文件,并生成第一文本和第二文本,所述第一文本包括第一时间标记,所述第二文本包括第二时间标记;根据所述第一文本和所述第二文本生成第三文本,所述第三文本包括第三时间标记,剪切所述第一音频文件和所述第二音频文件,以生成第三音频文件,其中,所述第一文本包括多个第一文本段,所述第一时间标记包括对应于所述多个第一文本段的多个时间信息,所述第二文本包括多个第二文本段,所述第二时间标记包括对应于所述多个第二文本段的多个时间信息,所述第三文本包括多个第三文本段,所述第三时间标记包括对应于所述多个第三文本段的多个时间信息,所述多个第三文本段由所述多个第一文本段和所述多个第二文本段中的一个或多个构成,所述第三时间标记根据所述多个第三文本段和所述多个第一文本段、所述多个第二文本段在内容上的对应关系生成。2.根据权利要求1所述的视频剪辑方法,其中,所述第一音频文件根据A机位拍摄视频获得,所述第二音频文件根据B机位拍摄视频获得。3.根据权利要求2所述的视频剪辑方法,还包括:以所述第三音频文件替换所述第一音频文件或所述第二音频文件,得到新的视频,其中,所述第一音频文件或所述第二音频文件为视频的音频文件。4.根据权利要求1所述的视频剪辑方法,其中,所述剪切所述第一音频文件和所述第二音频文件,以生成第三音频文件包括:根据所述对应关系从所述第一音频文件和/或所述第二音频文件中切割出多个音频片段;以及将所述多个音频片段组合成所述第三音频文件。5.根据权利要求1所述的视频剪辑方法,还包括:格式转换模块,在所述识别所述第一音频文件和所述第二音频文件的步骤之前,将所述第一音频文件和所述第二音频文件从一种音频格式转换成另一种音频格式。6.根据权利要求1至5任一项所述的视频剪辑方法,所述第一时...

【专利技术属性】
技术研发人员:李景颉
申请(专利权)人:北京秀眼科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1