The invention discloses an audio and video processing method, a device, an electronic device and a storage medium, belonging to the field of data processing. According to the audio similarity of at least two audio and video corresponding audio data, the embodiment of the present invention can automatically determine the alternative video clips with alignment relationship in at least two audio and video clips, and further, different alternative video clips can be processed into the same target video clip to generate the target audio and video based on the target video clip, thus realizing the efficient implementation of the proposed method. The aim of merging at least two audio and video into one audio and video is to avoid the problems of low efficiency and high cost caused by manual audio and video editing.
【技术实现步骤摘要】
音视频处理方法、装置、电子设备及存储介质
本专利技术涉及数据处理领域,特别涉及一种音视频处理方法、装置、电子设备及存储介质。
技术介绍
随着数据处理技术的不断发展,对音视频处理方法越来越多。例如,为了满足用户对音视频的多样化需求,可以对不同的音视频进行时间对齐、合成以及拼接等处理,以将该不同的音视频处理为同一音视频。目前,常用的音视频处理方法为将不同的音视频导入音视频剪辑应用中,基于该音视频剪辑应用,通过人工的方式,将该不同的音视频剪辑为各个音视频片段,进而,手动将符合需求的音视频片段合成或者拼接在一起,最终实现将该不同的音视频处理为同一音视频的目的。基于上述音视频处理方法,需要通过人工的方式对音视频进行合成或者拼接,处理效率较低,且,人力成本较高,不能快捷地将多个不同的音视频合成或者拼接为同一音视频。
技术实现思路
本专利技术实施例提供了一种音视频处理方法、装置、电子设备及存储介质,能够解决人工合成或拼接音视频效率低且成本高的问题。所述技术方案如下:一方面,提供了一种音视频处理方法,所述方法包括:获取至少两个音视频;根据所述至少两个音视频对应的音频数据,在所述至少两个音视频对应的视频数据中,分别确定具有对齐关系的备选视频片段,所述对齐关系用于表示视频片段所对应的音频数据的音频相似度符合预设条件;基于所述具有对齐关系的备选视频片段,生成目标视频片段;基于任一个音视频,将所述任一个音视频的备选视频片段替换为所述目标视频片段,生成目标音视频。一方面,提供了一种音视频处理方法,所述方法包括:获取至少两个音视频;根据所述至少两个音视频对应的音频数据,在所述至少两个音视 ...
【技术保护点】
1.一种音视频处理方法,其特征在于,所述方法包括:获取至少两个音视频;根据所述至少两个音视频对应的音频数据,在所述至少两个音视频对应的视频数据中,分别确定具有对齐关系的备选视频片段,所述对齐关系用于表示视频片段所对应的音频数据的音频相似度符合预设条件;基于所述具有对齐关系的备选视频片段,生成目标视频片段;基于任一个音视频,将所述任一个音视频的备选视频片段替换为所述目标视频片段,生成目标音视频。
【技术特征摘要】
1.一种音视频处理方法,其特征在于,所述方法包括:获取至少两个音视频;根据所述至少两个音视频对应的音频数据,在所述至少两个音视频对应的视频数据中,分别确定具有对齐关系的备选视频片段,所述对齐关系用于表示视频片段所对应的音频数据的音频相似度符合预设条件;基于所述具有对齐关系的备选视频片段,生成目标视频片段;基于任一个音视频,将所述任一个音视频的备选视频片段替换为所述目标视频片段,生成目标音视频。2.根据权利要求1所述的方法,其特征在于,所述基于所述具有对齐关系的备选视频片段,生成目标视频片段包括:当不同音视频的备选视频片段的时长相同时,将所述不同音视频的备选视频片段进行合并,生成所述目标视频片段;或,当所述不同音视频的备选视频片段的时长不相同时,将所述不同音视频的备选视频片段处理为时长相等的视频片段,将所述时长相等的视频片段进行合并,生成所述目标视频片段。3.根据权利要求2所述的方法,其特征在于,所述当不同音视频的备选视频片段的时长相同时,将所述不同音视频的备选视频片段进行合并,生成所述目标视频片段包括:基于视频画布的尺寸和预设规则,对各个备选视频片段中的视频帧图像进行截取,得到所述各个备选视频片段的目标区域;将所述各个备选视频片段的目标区域按照所属图像帧绘制在所述视频画布中,得到多个目标视频帧图像;将所述多个目标视频帧图像拼接为所述目标视频片段。4.根据权利要求1所述的方法,其特征在于,所述根据所述至少两个音视频对应的音频数据,在所述至少两个音视频对应的视频数据中,分别确定具有对齐关系的备选视频片段包括:获取所述至少两个音视频的音频特征矩阵,每个音频特征矩阵用于表示每个音视频对应的音频数据的音频特征;基于所述至少两个音视频的音频特征矩阵,在所述至少两个音视频对应的视频数据中,分别确定所述具有对齐关系的备选视频片段。5.根据权利要求4所述的方法,其特征在于,所述基于所述至少两个音视频的音频特征矩阵,在所述至少两个音视频对应的视频数据中,分别确定具有对齐关系的备选视频片段包括:基于所述至少两个音视频的音频特征矩阵,获取每两个音视频之间的最小总距离路径;对所述最小总距离路径的各个线段进行分析,确定所述每两个音视频之间具有所述对齐关系的各个音频片段;基于具有所述对齐关系的各个音频片段,确定具有所述对齐关系的备选视频片段。6.根据权利要求5所述的方法,其特征在于,所述基于所述至少两个音视频的音频特征矩阵,获取每两个音视频之间的最小总距离路径包括:基于所述至少两个音视频的音频特征矩阵,获取多个子矩阵,每个子矩阵对应的时长相等,每两个子矩阵之间的时间间隔相等;基于所述至少两个音视频的多个子矩阵,获取综合距离矩阵,所述综合距离矩阵用于表示所述每两个音视频之间的音频相似度;基于所述综合距离矩阵,获取所述每两个音视频之间的最小总距离路径。7.根据权利要求6所述的方法,其特征在于,所述基于所述至少两个音视频的多个子矩阵,获取综合距离矩阵包括:基于所述至少两个音视频的多个子矩阵,获取所述每两个音视频之间的第一距离矩阵和第二距离矩阵;基于所述第一距离矩阵和所述第二距离矩阵,得到所述综合距离矩阵。8.一种音视频处理方法,其特征在于,所述方法包括:获取至少两个音视频;根据所述至少两个音视频对应的音频数据,在所述至少两个音视频对应的视频数据中,分别确定具有对齐关系的备选视频片段,所述对齐关系用于表示视频片段所对应的音频数据的音频相似度符合预设条件;对于所述至少两个音视频中任意两个音视频,将其中一个音视频的备选视频片段替换为另一个音视频的备选视频片段,生成目标音视频。9.根据权利要求8所述的方法,其特征在于,所述分别确定具有对齐关系的备选视频片段之后,所述方法还包括:将所述其中一个音视频的备选视频片段对应的音频片段替换为所述另一个音视频的备选视频片段对应的音频片段。10.一种音视频处理装置,其特征在于,所述装置包括:获取模块,用于获取至少两个音视频;确定模块,用于根据所...
【专利技术属性】
技术研发人员:黄安麒,李深远,董治,
申请(专利权)人:腾讯音乐娱乐科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。