音视频剪辑方法及装置制造方法及图纸

技术编号:34801199 阅读:11 留言:0更新日期:2022-09-03 20:07
本说明书提供音视频剪辑方法及装置,其中所述音视频剪辑方法包括:获取待剪辑音视频,并确定所述待剪辑音视频关联的音频文件;基于所述待剪辑音视频关联的目标语义将所述音频文件转换为至少一个音频文本,以及确定每个音频文本对应的文本时间区间;根据所述目标语义在所述至少一个音频文本中确定目标音频文本,并确定所述目标音频文本对应的目标文本时间区间;按照所述目标文本时间区间对所述待剪辑音视频进行剪辑,获得目标音视频。获得目标音视频。获得目标音视频。

【技术实现步骤摘要】
音视频剪辑方法及装置


[0001]本说明书涉及计算机
,特别涉及一种音视频剪辑方法。本说明书同时涉及一种音视频剪辑装置,一种计算设备,以及一种计算机可读存储介质。

技术介绍

[0002]当前,为了提升用户观看视频的效率,需要对视频进行剪辑,删除重复内容或用户不感兴趣的内容。
[0003]然而,当前对音视频的剪辑方式为:人工删除不符合需求的视频片段,从而影响了对音视频的剪辑效率。
[0004]因此,亟待一种音视频剪辑方法,提升对音视频的剪辑效率。

技术实现思路

[0005]有鉴于此,本说明书实施例提供了一种音视频剪辑方法。本说明书同时涉及一种音视频剪辑装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。
[0006]根据本说明书实施例的第一方面,提供了一种音视频剪辑方法,包括:
[0007]获取待剪辑音视频,并确定所述待剪辑音视频关联的音频文件;
[0008]基于所述待剪辑音视频关联的目标语义将所述音频文件转换为至少一个音频文本,以及确定每个音频文本对应的文本时间区间;
[0009]根据所述目标语义在所述至少一个音频文本中确定目标音频文本,并确定所述目标音频文本对应的目标文本时间区间;
[0010]按照所述目标文本时间区间对所述待剪辑音视频进行剪辑,获得目标音视频。
[0011]根据本说明书实施例的第二方面,提供了一种音视频剪辑装置,包括:
[0012]获取模块,被配置为获取待剪辑音视频,并确定所述待剪辑音视频关联的音频文件;
[0013]转换模块,被配置为基于所述待剪辑音视频关联的目标语义将所述音频文件转换为至少一个音频文本,以及确定每个音频文本对应的文本时间区间;
[0014]确定模块,被配置为根据所述目标语义在所述至少一个音频文本中确定目标音频文本,并确定所述目标音频文本对应的目标文本时间区间;
[0015]剪辑模块,被配置为按照所述目标文本时间区间对所述待剪辑音视频进行剪辑,获得目标音视频。
[0016]根据本说明书实施例的第三方面,提供了一种计算设备,包括:
[0017]存储器和处理器;
[0018]所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
[0019]获取待剪辑音视频,并确定所述待剪辑音视频关联的音频文件;
[0020]基于所述待剪辑音视频关联的目标语义将所述音频文件转换为至少一个音频文本,以及确定每个音频文本对应的文本时间区间;
[0021]根据所述目标语义在所述至少一个音频文本中确定目标音频文本,并确定所述目标音频文本对应的目标文本时间区间;
[0022]按照所述目标文本时间区间对所述待剪辑音视频进行剪辑,获得目标音视频。
[0023]根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现所述音视频剪辑方法的步骤。
[0024]本说明书提供的音视频剪辑方法,获取待剪辑音视频,并确定所述待剪辑音视频关联的音频文件;基于所述待剪辑音视频关联的目标语义将所述音频文件转换为至少一个音频文本,以及确定每个音频文本对应的文本时间区间;根据所述目标语义在所述至少一个音频文本中确定目标音频文本,并确定所述目标音频文本对应的目标文本时间区间;按照所述目标文本时间区间对所述待剪辑音视频进行剪辑,获得目标音视频。
[0025]本说明书一实施例实现了基于待剪辑音视频关联的目标语义转换音频文件,提升了得到的音频文本在后续进行语义分析时的准确性;按照目标音频文本对应的目标文本时间区间对待剪辑音视频进行剪辑,提升了对待剪辑音视频的剪辑效率。
附图说明
[0026]图1是本说明书一实施例提供的一种音视频剪辑方法的流程图;
[0027]图2是本说明书一实施例提供的一种元素恢复模型示意图;
[0028]图3是本说明书一实施例提供的一种应用于待剪辑面试音视频的音视频剪辑方法的处理流程图;
[0029]图4是本说明书一实施例提供的一种音视频剪辑装置的结构示意图;
[0030]图5是本说明书一实施例提供的一种计算设备的结构框图。
具体实施方式
[0031]在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
[0032]在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0033]应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
[0034]首先,对本申请一个或多个实施例涉及的名词术语进行解释。
[0035]RNN

Transducer:一种基于循环神经网络的语音识别模型。
[0036]CTC:Connectionist Temporal Classification,自动对齐两个不等长序列的方法。
[0037]BERT:Bidirectional Encoder Representations from Transformers,是一种用来学习文本表征的双向编码技术。
[0038]在本说明书中,提供了一种音视频剪辑方法,本说明书同时涉及一种音视频剪辑装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
[0039]图1示出了根据本说明书一实施例提供的一种音视频剪辑方法的流程图,具体包括以下步骤:
[0040]步骤102:获取待剪辑音视频,并确定所述待剪辑音视频关联的音频文件。
[0041]其中,待剪辑音视频是指存在剪辑需求的,并且包含音频流和视频流的视频文件,例如,视频H中包含多段重复内容,或一批视频中包含同类内容,如均包含自我介绍内容的视频组成的视频集合;则可以将视频集合中的每个视频作为待剪辑音视频;音频文件是指从待剪辑音视频中获取到的音频文件;在实际应用中,确定待剪辑音视频后,采集待剪辑音视频的音频流,并对采集到的音频流进行保存,得到与待剪辑音视频关联的音频文件。...

【技术保护点】

【技术特征摘要】
1.一种音视频剪辑方法,其特征在于,包括:获取待剪辑音视频,并确定所述待剪辑音视频关联的音频文件;基于所述待剪辑音视频关联的目标语义将所述音频文件转换为至少一个音频文本,以及确定每个音频文本对应的文本时间区间;根据所述目标语义在所述至少一个音频文本中确定目标音频文本,并确定所述目标音频文本对应的目标文本时间区间;按照所述目标文本时间区间对所述待剪辑音视频进行剪辑,获得目标音视频。2.如权利要求1所述的方法,其特征在于,基于所述待剪辑音视频关联的目标语义将所述音频文件转换为至少一个音频文本,包括:将所述音频文件输入至语音转换模型;通过所述语音转换模型中的特征提取单元对所述音频文件进行处理,获得音频特征;通过所述语音转换模型中的音频特征处理单元对所述音频特征进行处理,获得待解码音频特征;通过所述语音转换模型中的解码单元,在预设的语义词语列表中确定关联所述音频文件的目标语义词;通过所述解码单元按照所述目标语义词对应的所述目标语义,对所述待解码音频特征进行解码处理,获得至少一个音频文本并输出所述语音转换模型。3.如权利要求2所述的方法,其特征在于,通过所述解码单元按照所述目标语义词对应的所述目标语义,对所述待解码音频特征进行解码处理,获得至少一个音频文本并输出所述语音转换模型,包括:通过所述解码单元按照所述目标语义词对应的所述目标语义,对所述待解码音频特征进行处理,获得至少一个初始音频文本,其中,每个初始音频文本携带有文本权重;对所述至少一个初始音频文本中,与所述目标语义词关联的初始音频文本的文本权重进行调整,获得至少一个携带有目标文本权重的音频文本。4.如权利要求2所述的方法,其特征在于,通过所述解码单元按照所述目标语义词对应的所述目标语义,对所述待解码音频特征进行解码处理,获得至少一个音频文本并输出所述语音转换模型,包括:通过所述解码单元按照所述目标语义词对应的所述目标语义,对所述待解码音频特征进行解码处理,获得多个解码向量;通过所述语音转换模型的输出单元对每个解码向量进行转换,获得每个解码向量对应的词单元;通过所述输出单元对每个解码向量对应的词单元与所述音频文件进行对齐,获得携带有时间信息的所述至少一个音频文本并输出所述语音转换模型;相应的,确定每个音频文本对应的文本时间区间,包括:根据所述至少一个音频文本中携带的时间信息,确定每个音频文本对应的文本时间区间。5.如权利要求3所述的方法,其特征在于,通过所述解码单元按照所述目...

【专利技术属性】
技术研发人员:高强李旭刘杨李强
申请(专利权)人:北京飞象星球科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1