The present invention discloses a video clipping method and editing system, including step 1: decode video files and separate audio and video from the frame data, audio frame data, and synchronization table of frame and audio frames; step 2: synchronize audio data into text; step 3: get the beginning of each syllable in audio. Time, termination time, and bottom noise or mute area, and the synchronization timestamp of syllables in text and audio; step 4: editing text or audio in the clip window, and then according to the synchronization table of the frame and audio frame of the picture, the synchronous time stamp synchronously clips the frame data, audio frame data, or synchronously clips the frame. Data and text; step 5: encapsulate and export the frame data, audio frame data and text after editing. The above methods can greatly improve the efficiency of video clip.
【技术实现步骤摘要】
一种视频剪辑方法和剪辑系统
本专利技术属于视频语音、音频剪辑、中文文字编辑的
,具体涉及一种视频剪辑方法和剪辑系统。
技术介绍
传统广播电台、电视台的语音类音频内容编辑,主要是利用通用的视频编辑软件实现(如AdobePremierePro软件,FinalCutPro软件),此类软件本身没有同步文本编辑窗口,如图1所示,需要完全依靠人耳的听觉控制来进行人工剪切和修饰,效率及准确率不高。其中,一般是监听视频稿件中的伴音,人工理解对应的文字稿,然后再用wps软件和audition软件的不停切换方式工作,边修改文本文件边编辑音频和视频,关于音频和视频的修改则依托人工监听、监看,通过人脑记忆,逐字逐句的进行听写和校对。即文字的删减调整和视频、伴音的删减调整需要分三步完成,导致在重大节目播出时,视频稿和文字稿因审稿、不同渠道发布的需要,必须一一对应时,编辑的工作将消耗大量的工作时间,且工作过程繁琐而枯燥。
技术实现思路
本专利技术的目的是提供一种视频剪辑方法和剪辑系统,能够建立视频中视频画面、伴音以及文字的同步机制,再利用同步机制实现同步剪辑。第一方面,本专利技术提供一种视 ...
【技术保护点】
1.一种视频剪辑方法,其特征在于:包括如下步骤:步骤1:解码视频文件并进行音视频分离得到画面帧数据、音频帧数据以及画面帧和音频帧的同步表;其中,所述画面帧和音频帧的同步表包括每个音频帧与音频时长、画面帧以及视频时长的对应关系,所述音频帧数据以时间为横轴坐标、幅度为纵轴坐标的音频波,所述音频波上分布离散采样点;步骤2:将音频数据同步翻译为文字;步骤3:获取音频中每个音节的起始时刻、终止时刻以及底噪或静音区,并构建文字与音频中音节的同步时间戳;其中,所述同步时间戳包括每个文字与对应音节在起始时刻、终止时刻、底噪或静音区的标记编号;步骤4:在剪辑窗口剪辑文字或者音频,再依据所述画 ...
【技术特征摘要】
1.一种视频剪辑方法,其特征在于:包括如下步骤:步骤1:解码视频文件并进行音视频分离得到画面帧数据、音频帧数据以及画面帧和音频帧的同步表;其中,所述画面帧和音频帧的同步表包括每个音频帧与音频时长、画面帧以及视频时长的对应关系,所述音频帧数据以时间为横轴坐标、幅度为纵轴坐标的音频波,所述音频波上分布离散采样点;步骤2:将音频数据同步翻译为文字;步骤3:获取音频中每个音节的起始时刻、终止时刻以及底噪或静音区,并构建文字与音频中音节的同步时间戳;其中,所述同步时间戳包括每个文字与对应音节在起始时刻、终止时刻、底噪或静音区的标记编号;步骤4:在剪辑窗口剪辑文字或者音频,再依据所述画面帧和音频帧的同步表,所述同步时间戳同步剪辑画面帧数据、音频帧数据或者同步剪辑画面帧数据和文字;a:在剪辑窗口剪辑文字时,依据所述同步时间戳获取所选定的文字对应在音频中的标记编号,再根据所述标记编号获取音频剪辑范围,然后再依据所述画面帧和音频帧的同步表判断所述音频剪辑范围内是否存在对应的画面帧,若存在,所述音频剪辑范围内对应的画面帧为待剪辑的画面帧;b:在剪辑窗口剪辑音频时,获取音频剪辑范围,再依据所述同步时间戳获取文字剪辑范围,以及依据所述画面帧和音频帧的同步表判断所述音频剪辑范围内是否存在对应的画面帧,若存在,所述音频剪辑范围内对应的画面帧为待剪辑的画面帧;步骤5:将剪辑后的画面帧数据、音频帧数据以及文字进行封装导出。2.根据权利要求1所述的方法,其特征在于:步骤3中所述构建文字与音频中音节的同步时间戳的过程如下:S1:将所述音频波进行区间划分;其中,每个区间包括x个采样点,音频波的采样频率低于或等于48kHz,x的取值范围为50-150,音频波的采样频率为96kHz或88.2kHz,x的取值范围为100-300,音频波的采样频率为192kHz,x的取值范围为200-600;S2:计算每个区间的平均相对电平值;其中,区间的平均相对电平值计算公式如下:X=0000,0000,0000,0001式中,表示第n个区间的平均相对电平值,分别表示第n个区间中第1、2、x个采样点的幅度的绝对值,X表示量化比特数为16位的预设的取样信号,n为正整数;S3:依据每个区间的平均相对电平值获取每个区间的节点识别参数;其中,所述节点识别参数包括电平参数和电平变化参数:式中,表示第n个区间的电平参数,表示第n个区间的电平变化参数;S4:依据每个区间的节点识别参数以及预设的节点识别标准获取音频中每个音节起始时刻、终止时刻以及底噪或静音区,并依次进行标记编号;其中,一个音节的终止时刻至后一相邻音节的起始时刻为音节的底噪或静音区;S5:依据步骤1中的文字以及步骤5中标记编号构建文字与语音中音节的时刻同步表,得...
【专利技术属性】
技术研发人员:牛嵩峰,周晓民,唐炜,
申请(专利权)人:湖南广播电视台广播传媒中心,
类型:发明
国别省市:湖南,43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。