音视频处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:21167894 阅读:49 留言:0更新日期:2019-05-22 09:51
本发明专利技术公开了一种音视频处理方法、装置、电子设备及存储介质,属于数据处理领域。本发明专利技术实施例可以根据至少两个音视频对应的音频数据的音频相似度,自动确定该至少两个音视频中具有对齐关系的备选视频片段,进而,可以将不同的备选视频片段处理为同一个目标视频片段,以基于该目标视频片段,生成目标音视频,从而,实现了高效地将该至少两个音视频合并为一个音视频的目的,避免了人工剪辑音视频所造成的效率低以及成本高等问题。

Audio and video processing methods, devices, electronic devices and storage media

The invention discloses an audio and video processing method, a device, an electronic device and a storage medium, belonging to the field of data processing. According to the audio similarity of at least two audio and video corresponding audio data, the embodiment of the present invention can automatically determine the alternative video clips with alignment relationship in at least two audio and video clips, and further, different alternative video clips can be processed into the same target video clip to generate the target audio and video based on the target video clip, thus realizing the efficient implementation of the proposed method. The aim of merging at least two audio and video into one audio and video is to avoid the problems of low efficiency and high cost caused by manual audio and video editing.

【技术实现步骤摘要】
音视频处理方法、装置、电子设备及存储介质
本专利技术涉及数据处理领域,特别涉及一种音视频处理方法、装置、电子设备及存储介质。
技术介绍
随着数据处理技术的不断发展,对音视频处理方法越来越多。例如,为了满足用户对音视频的多样化需求,可以对不同的音视频进行时间对齐、合成以及拼接等处理,以将该不同的音视频处理为同一音视频。目前,常用的音视频处理方法为将不同的音视频导入音视频剪辑应用中,基于该音视频剪辑应用,通过人工的方式,将该不同的音视频剪辑为各个音视频片段,进而,手动将符合需求的音视频片段合成或者拼接在一起,最终实现将该不同的音视频处理为同一音视频的目的。基于上述音视频处理方法,需要通过人工的方式对音视频进行合成或者拼接,处理效率较低,且,人力成本较高,不能快捷地将多个不同的音视频合成或者拼接为同一音视频。
技术实现思路
本专利技术实施例提供了一种音视频处理方法、装置、电子设备及存储介质,能够解决人工合成或拼接音视频效率低且成本高的问题。所述技术方案如下:一方面,提供了一种音视频处理方法,所述方法包括:获取至少两个音视频;根据所述至少两个音视频对应的音频数据,在所述至少两个音视频对应的视频数据中,分别确定具有对齐关系的备选视频片段,所述对齐关系用于表示视频片段所对应的音频数据的音频相似度符合预设条件;基于所述具有对齐关系的备选视频片段,生成目标视频片段;基于任一个音视频,将所述任一个音视频的备选视频片段替换为所述目标视频片段,生成目标音视频。一方面,提供了一种音视频处理方法,所述方法包括:获取至少两个音视频;根据所述至少两个音视频对应的音频数据,在所述至少两个音视频对应的视频数据中,分别确定具有对齐关系的备选视频片段,所述对齐关系用于表示视频片段所对应的音频数据的音频相似度符合预设条件;对于所述至少两个音视频中任意两个音视频,将其中一个音视频的备选视频片段替换为另一个音视频的备选视频片段,生成目标音视频。一方面,提供了一种音视频处理装置,所述装置包括:获取模块,用于获取至少两个音视频;确定模块,用于根据所述至少两个音视频对应的音频数据,在所述至少两个音视频对应的视频数据中,分别确定具有对齐关系的备选视频片段,所述对齐关系用于表示视频片段所对应的音频数据的音频相似度符合预设条件;第一生成模块,用于基于所述具有对齐关系的备选视频片段,生成目标视频片段;第二生成模块,用于基于任一个音视频,将所述任一个音视频的备选视频片段替换为所述目标视频片段,生成目标音视频。一方面,提供了一种音视频处理装置,所述装置包括:获取模块,用于获取至少两个音视频;确定模块,用于根据所述至少两个音视频对应的音频数据,在所述至少两个音视频对应的视频数据中,分别确定具有对齐关系的备选视频片段,所述对齐关系用于表示视频片段所对应的音频数据的音频相似度符合预设条件;生成模块,用于对于所述至少两个音视频中任意两个音视频,将其中一个音视频的备选视频片段替换为另一个音视频的备选视频片段,生成目标音视频。一方面,提供了一种电子设备,所述电子设备包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条指令,所述指令由所述一个或多个处理器加载并执行以实现如上述音视频处理方法所执行的操作。一方面,提供了一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述指令由一个或多个处理器加载并执行以实现如上述音视频处理方法所执行的操作。本专利技术实施例可以根据至少两个音视频对应的音频数据的音频相似度,自动确定该至少两个音视频中具有对齐关系的备选视频片段,进而,可以将不同的备选视频片段处理为同一个目标视频片段,以基于该目标视频片段,生成目标音视频,从而,实现了高效地将该至少两个音视频合并为一个音视频的目的,避免了人工剪辑音视频所造成的效率低以及成本高等问题。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种音视频处理方法的实施环境示意图;图2是本专利技术实施例提供的一种音视频处理方法的流程图;图3是本专利技术实施例提供的一种音视频处理方法的流程图;图4是本专利技术实施例提供的一种音视频处理装置的结构示意图;图5是本专利技术实施例提供的一种音视频处理装置的结构示意图;图6是本专利技术实施例提供的一种终端600的结构框图;图7是本专利技术实施例提供的一种服务器700的结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施方式作进一步地详细描述。图1是本专利技术实施例提供的一种音视频处理方法的实施环境示意图。参见图1,该实施环境包括多个电子设备,该电子设备可以为多个终端101或者用于为该多个终端提供服务的服务器102。多个终端101通过无线或者有线网络和服务器102连接,该多个终端101可以访问服务器102,该多个终端101可以为电脑、智能手机、平板电脑或者其他电子设备,该多个终端101可以为用户提供音视频存储功能以及音视频处理功能等。服务器102可以为一个或者多个网站服务器,该服务器102可以作为多媒体文件的载体,该服务器102可以为用户提供视频播放、音频播放等多媒体功能,当然,该服务器102还可以在此基础上,为用户提供音视频处理等功能。对于服务器102来说,该服务器102还可以具有至少一种数据库,用以存储音视频等多媒体文件以及用户信息等。图2是本专利技术实施例提供的一种音视频处理方法的流程图。参见图2,该实施例包括:201、电子设备获取至少两个音视频。在本专利技术实施例中,该电子设备具有存储功能和音视频处理功能,该至少两个音视频可以为具有相似音频内容的音视频,例如,该至少两个音视频可以为同一首歌曲的不同版本的音视频,例如,该不同版本的音视频可以包括该同一首歌曲的原版音视频以及翻唱音视频等,本专利技术实施例在此对该至少两个音视频不做具体限定。其中,该电子设备可以是终端,也可以是服务器。例如,该电子设备为终端,终端可以直接通过录制功能来获取该至少两个音视频,该终端也可以从服务器或者其他终端获取该至少两个音视频。当然,该电子设备也可以为服务器,服务器可以接收终端发送的该至少两个音视频。本专利技术实施例在此对获取该至少连个音视频的电子设备不做限定。202、电子设备根据该至少两个音视频对应的音频数据,获取该至少两个音视频的音频特征矩阵。在本专利技术实施例中,该音频数据为从每个音视频中分离得到的音频数据,每个音频特征矩阵用于表示每个音视频对应的音频数据的音频特征,例如,该音频特征可以为基频、幅值以及音高等。例如,电子设备获取该至少两个音视频的音频特征矩阵的过程可以包括以下步骤202A至步骤202B:202A:电子设备基于该至少两个音视频,获取每个音视频对应的音频数据。具体地,电子设备可以通过音频分离工具,对该至少两个音视频中的每个音视频分别进行处理,以分离出每个音视频中的音频数据。相应地,电子设备也可以从每个音视频中分离出对应的视频数据。其中,该音频分离工具可以为RealMediaAnalyzer工具,当然,该音频分离工具还可以为其他工具本文档来自技高网...

【技术保护点】
1.一种音视频处理方法,其特征在于,所述方法包括:获取至少两个音视频;根据所述至少两个音视频对应的音频数据,在所述至少两个音视频对应的视频数据中,分别确定具有对齐关系的备选视频片段,所述对齐关系用于表示视频片段所对应的音频数据的音频相似度符合预设条件;基于所述具有对齐关系的备选视频片段,生成目标视频片段;基于任一个音视频,将所述任一个音视频的备选视频片段替换为所述目标视频片段,生成目标音视频。

【技术特征摘要】
1.一种音视频处理方法,其特征在于,所述方法包括:获取至少两个音视频;根据所述至少两个音视频对应的音频数据,在所述至少两个音视频对应的视频数据中,分别确定具有对齐关系的备选视频片段,所述对齐关系用于表示视频片段所对应的音频数据的音频相似度符合预设条件;基于所述具有对齐关系的备选视频片段,生成目标视频片段;基于任一个音视频,将所述任一个音视频的备选视频片段替换为所述目标视频片段,生成目标音视频。2.根据权利要求1所述的方法,其特征在于,所述基于所述具有对齐关系的备选视频片段,生成目标视频片段包括:当不同音视频的备选视频片段的时长相同时,将所述不同音视频的备选视频片段进行合并,生成所述目标视频片段;或,当所述不同音视频的备选视频片段的时长不相同时,将所述不同音视频的备选视频片段处理为时长相等的视频片段,将所述时长相等的视频片段进行合并,生成所述目标视频片段。3.根据权利要求2所述的方法,其特征在于,所述当不同音视频的备选视频片段的时长相同时,将所述不同音视频的备选视频片段进行合并,生成所述目标视频片段包括:基于视频画布的尺寸和预设规则,对各个备选视频片段中的视频帧图像进行截取,得到所述各个备选视频片段的目标区域;将所述各个备选视频片段的目标区域按照所属图像帧绘制在所述视频画布中,得到多个目标视频帧图像;将所述多个目标视频帧图像拼接为所述目标视频片段。4.根据权利要求1所述的方法,其特征在于,所述根据所述至少两个音视频对应的音频数据,在所述至少两个音视频对应的视频数据中,分别确定具有对齐关系的备选视频片段包括:获取所述至少两个音视频的音频特征矩阵,每个音频特征矩阵用于表示每个音视频对应的音频数据的音频特征;基于所述至少两个音视频的音频特征矩阵,在所述至少两个音视频对应的视频数据中,分别确定所述具有对齐关系的备选视频片段。5.根据权利要求4所述的方法,其特征在于,所述基于所述至少两个音视频的音频特征矩阵,在所述至少两个音视频对应的视频数据中,分别确定具有对齐关系的备选视频片段包括:基于所述至少两个音视频的音频特征矩阵,获取每两个音视频之间的最小总距离路径;对所述最小总距离路径的各个线段进行分析,确定所述每两个音视频之间具有所述对齐关系的各个音频片段;基于具有所述对齐关系的各个音频片段,确定具有所述对齐关系的备选视频片段。6.根据权利要求5所述的方法,其特征在于,所述基于所述至少两个音视频的音频特征矩阵,获取每两个音视频之间的最小总距离路径包括:基于所述至少两个音视频的音频特征矩阵,获取多个子矩阵,每个子矩阵对应的时长相等,每两个子矩阵之间的时间间隔相等;基于所述至少两个音视频的多个子矩阵,获取综合距离矩阵,所述综合距离矩阵用于表示所述每两个音视频之间的音频相似度;基于所述综合距离矩阵,获取所述每两个音视频之间的最小总距离路径。7.根据权利要求6所述的方法,其特征在于,所述基于所述至少两个音视频的多个子矩阵,获取综合距离矩阵包括:基于所述至少两个音视频的多个子矩阵,获取所述每两个音视频之间的第一距离矩阵和第二距离矩阵;基于所述第一距离矩阵和所述第二距离矩阵,得到所述综合距离矩阵。8.一种音视频处理方法,其特征在于,所述方法包括:获取至少两个音视频;根据所述至少两个音视频对应的音频数据,在所述至少两个音视频对应的视频数据中,分别确定具有对齐关系的备选视频片段,所述对齐关系用于表示视频片段所对应的音频数据的音频相似度符合预设条件;对于所述至少两个音视频中任意两个音视频,将其中一个音视频的备选视频片段替换为另一个音视频的备选视频片段,生成目标音视频。9.根据权利要求8所述的方法,其特征在于,所述分别确定具有对齐关系的备选视频片段之后,所述方法还包括:将所述其中一个音视频的备选视频片段对应的音频片段替换为所述另一个音视频的备选视频片段对应的音频片段。10.一种音视频处理装置,其特征在于,所述装置包括:获取模块,用于获取至少两个音视频;确定模块,用于根据所...

【专利技术属性】
技术研发人员:黄安麒李深远董治
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1