视频处理方法、视频处理装置和电子设备制造方法及图纸

技术编号:36251454 阅读:40 留言:0更新日期:2023-01-07 09:44
本申请公开了一种视频处理方法、视频处理装置和电子设备,属于电子技术领域。所述视频处理方法,包括:获取图像序列和多个音频信息,所述多个音频信息与多个语音对象一一对应;基于所述图像序列对应的特征、所述音频信息对应的特征和所述语音对象对应的特征中的至少一种,从所述多个音频信息中确定目标音频信息;基于所述图像序列和所述目标音频信息,生成目标视频。标视频。标视频。

【技术实现步骤摘要】
视频处理方法、视频处理装置和电子设备


[0001]本申请属于电子
,具体涉及一种视频处理方法、视频处理装置和电子设备。

技术介绍

[0002]用户在使用电子设备进行拍摄时,会一并采集图像序列和音频信息。相关技术中,在进行视频播放时,电子设备会一并播放所采集的全部图像序列和音频信息。该方法使得视频生成的方式单一。

技术实现思路

[0003]本申请实施例的目的是提供一种视频处理方法、视频处理装置和电子设备,能够解决视频生成的方式单一的问题。
[0004]第一方面,本申请实施例提供了一种视频处理方法,该方法包括:
[0005]获取图像序列和多个音频信息,所述多个音频信息与多个语音对象一一对应;
[0006]基于所述图像序列对应的特征、所述音频信息对应的特征和所述语音对象对应的特征中的至少一种,从所述多个音频信息中确定目标音频信息;
[0007]基于所述图像序列和所述目标音频信息,生成目标视频。
[0008]第二方面,本申请实施例提供了一种视频处理装置,该装置包括:
[0009]第一获取模块,用于获取图像序列和多个音频信息,所述多个音频信息与多个语音对象一一对应;
[0010]第一处理模块,用于基于所述图像序列对应的特征、所述音频信息对应的特征和所述语音对象对应的特征中的至少一种,从所述多个音频信息中确定目标音频信息;
[0011]第二处理模块,用于基于所述图像序列和所述目标音频信息,生成目标视频。
[0012]第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法。
[0013]第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法。
[0014]第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
[0015]第六方面,本申请实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如第一方面所述的方法。
[0016]在本申请实施例中,通过图像序列对应的特征、音频信息对应的特征和语音对象对应的特征中的至少一种,从多个音频信息中确定目标音频信息,并基于确定的目标音频信息和获取的图像序列合成目标视频,丰富了视频的生成方式。
附图说明
[0017]图1是本申请实施例提供的视频处理方法的流程示意图;
[0018]图2是本申请实施例提供的视频处理方法的界面示意图之一;
[0019]图3是本申请实施例提供的视频处理方法的界面示意图之二;
[0020]图4是本申请实施例提供的视频处理方法的界面示意图之三;
[0021]图5是本申请实施例提供的视频处理装置的结构示意图;
[0022]图6是本申请实施例提供的电子设备的结构示意图;
[0023]图7是本申请实施例提供的电子设备的硬件示意图。
具体实施方式
[0024]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本申请保护的范围。
[0025]本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
[0026]下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的视频处理方法、视频处理装置、电子设备和可读存储介质进行详细地说明。
[0027]其中,视频处理方法可应用于终端,具体可由,终端中的硬件或软件执行。
[0028]该终端包括但不限于具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的移动电话或平板电脑等其它便携式通信设备。还应当理解的是,在某些实施例中,该终端可以不是便携式通信设备,而是具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的台式计算机。
[0029]以下各个实施例中,描述了包括显示器和触摸敏感表面的终端。然而,应当理解的是,终端可以包括诸如物理键盘、鼠标和控制杆的一个或多个其它物理用户接口设备。
[0030]本申请实施例提供的视频处理方法,该视频处理方法的执行主体可以为电子设备或者电子设备中能够实现该视频处理方法的功能模块或功能实体,本申请实施例提及的电子设备包括但不限于手机、平板电脑、电脑、相机、可穿戴设备等,下面以电子设备作为执行主体为例对本申请实施例提供的视频处理方法进行说明。
[0031]如图1所示,该视频处理方法包括:步骤110、步骤120和步骤130。
[0032]步骤110、获取图像序列和多个音频信息,多个音频信息与多个语音对象一一对应;
[0033]在该步骤中,图像序列为通过图像传感器采集的图像信息。
[0034]图像序列包括多帧视频帧,其中,视频帧中可以包括人物信息、动物信息以及背景等信息。
[0035]图像序列可以包括多个对象,如人、动物或着其它物体等。图像序列所包括的对
象,可以包括发声对象(如人以及动物等),还可以包括不发声对象(如沙滩以及楼房等)。
[0036]多个音频信息为通过拾音器采集的音频,其中,音频信息包括但不限于人声、动物声、背景环境声以及其他声音等。
[0037]语音对象为多个音频信息中的发声对象。
[0038]其中,每一个音频信息对应一个语音对象,语音对象可以为人、动物、其他可以发声的物体、背景环境音以及噪声等。
[0039]语音对象为对多个音频信息进行语音特征识别所确定的。
[0040]需要说明的,本申请中的语音对象包括存在于图像序列中的发声对象,也包括不存在于图像序列中的语音对象。
[0041]步骤120、基于图像序列对应的特征、音频信息对应的特征和语音对象对应的特征中的至少一种,从多个音频信息中确定目标音频信息;
[0042]在该步骤中,目标音频信息为用于生成目标视频的音频信息。
[0043]其中,目标视频为最终生成或用于播放的视频。
[0044]目标音频信息的数量可以为一个或多个。
[0045]每一个目标音频信息对应于一个语音对象。
[0046]图像序列对应的特征为图像序列中每一个对象对应的图像本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频处理方法,其特征在于,包括:获取图像序列和多个音频信息,所述多个音频信息与多个语音对象一一对应;基于所述图像序列对应的特征、所述音频信息对应的特征和所述语音对象对应的特征中的至少一种,从所述多个音频信息中确定目标音频信息;基于所述图像序列和所述目标音频信息,生成目标视频。2.根据权利要求1所述的视频处理方法,其特征在于,所述基于所述图像序列对应的特征、所述音频信息对应的特征和所述语音对象对应的特征中的至少一种,从所述多个音频信息中确定目标音频信息,包括:对所述图像序列进行特征提取,得到多个图像特征;对所述多个音频信息进行特征提取得到多个文本信息;在所述多个文本信息中目标文本信息与所述图像特征匹配的情况下,将所述目标文本信息对应的音频信息确定为所述目标音频信息;或者,在所述多个图像特征包括所述多个语音对象中第一目标语音对象对应的特征的情况下,将所述第一目标语音对象对应的音频信息确定为所述目标音频信息;或者,在所述多个语音对象中第二目标语音对象对应的生理特征与所述图像特征对应的生理特征匹配的情况下,将所述第二目标语音对象对应的音频信息确定为所述目标音频信息;或者,在所述多个语音对象中第三目标语音对象对应的音频信息的质量满足目标条件的情况下,将所述第三目标语音对象对应的音频信息确定为所述目标音频信息。3.根据权利要求1所述的视频处理方法,其特征在于,所述方法还包括:显示目标界面,所述目标界面包括所述图像序列和多个标签,所述多个标签与所述多个所述语音对象一一对应,所述目标界面包括所述视频采集界面或视频播放界面。4.根据权利要求3所述的视频处理方法,其特征在于,所述标签包括所述语音对象的标识,以及所述语音对象对应的文本信息;所述文本信息为对与所述语音对象对应的音频信息进行文本特征识别确定的。5.根据权利要求4所述的视频处理方法,其特征在于,所述标识通过如下步骤确定:对所述多个音频信息进行语音特征识别,确定各所述音频信息对应的语音对象;对所述图像序列进行图像特征识别,确定所述图像序列中发声对象对应的头像信息;在所述语音对象与所述头像信息匹配的情况下,将所述头像信息确定为所述语音对象的标识;在所述语音对象与所述头像信息不匹配的情况下,将存储的目标预设头像确定为所述语音对象的标识。6.根据权利要求5所述的视频处理方法,其特征在于,所述在所述语音对象与所述头像信息不匹配的情况下,将存储的目标预设头像确定为所述语音对象的标识,包括:基于所述语音对象对应的音频信息的语音特征,确定所述语音对象的生理特征;基于所述生理特征,从存储的多个预设头像中筛选得...

【专利技术属性】
技术研发人员:向永航
申请(专利权)人:维沃移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1