视频处理方法、视频处理装置及终端设备制造方法及图纸

技术编号:26041968 阅读:44 留言:0更新日期:2020-10-23 21:21
本申请提供的一种视频处理方法,包括:若检测到当前视频帧的指定编辑信息,则获取所述当前视频帧中包含的目标对象;根据所述指定编辑信息和至少一个目标音频分量,对所述当前视频帧所对应的初始音频进行处理,获得目标音频,其中,任一所述目标音频分量为一个所述目标对象在所述初始音频中所对应的音频分量;将所述当前视频帧和所述目标音频进行关联,获得目标视频。通过上述方法,可以解决对视频帧进行调整以突出呈现某些内容之后,图像的视觉呈现效果和音频的声音呈现效果不匹配,导致所获得的视频的呈现效果较差的问题。

【技术实现步骤摘要】
视频处理方法、视频处理装置及终端设备
本申请属于视频处理
,尤其涉及视频处理方法、视频处理装置、终端设备及计算机可读存储介质。
技术介绍
在视频录像或者视频编辑等过程中,用户可能会通过缩放图像、调整对焦对象等方式对一些视频帧进行调整,以突出呈现某些内容。然而目前,在对视频帧进行调整以突出呈现某些内容之后,图像所对应的音频往往依然沿用原始的音频,使得图像的视觉呈现效果和音频的声音呈现效果不匹配,导致所获得的视频的呈现效果较差。
技术实现思路
本申请实施例提供了视频处理方法、视频处理装置、终端设备及计算机可读存储介质,可以解决对视频帧进行调整以突出呈现某些内容之后,图像的视觉呈现效果和音频的声音呈现效果不匹配,导致所获得的视频的呈现效果较差的问题。第一方面,本申请实施例提供了一种视频处理方法,包括:若检测到当前视频帧的指定编辑信息,则获取所述当前视频帧中包含的目标对象;根据所述指定编辑信息和至少一个目标音频分量,对所述当前视频帧所对应的初始音频进行处理,获得目标音频,其中,任一所述目标音频分量为一个所述目标对象在所述初始音频中所对应的音频分量;将所述当前视频帧和所述目标音频进行关联,获得目标视频。第二方面,本申请实施例提供了一种视频处理装置,包括:获取模块,用于若检测到当前视频帧的指定编辑信息,则获取所述当前视频帧中包含的目标对象;处理模块,用于根据所述指定编辑信息和至少一个目标音频分量,对所述当前视频帧所对应的初始音频进行处理,获得目标音频,其中,任一所述目标音频分量为一个所述目标对象在所述初始音频中所对应的音频分量;关联模块,用于将所述当前视频帧和所述目标音频进行关联,获得目标视频。第三方面,本申请实施例提供了一种终端设备,包括存储器、处理器、显示器以及存储在上述存储器中并可在上述处理器上运行的计算机程序,其特征在于,上述处理器执行上述计算机程序时实现如第一方面上述的视频处理方法。第四方面,本申请实施例提供了一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序被处理器执行时实现如第一方面上述的视频处理方法。第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面中上述的视频处理方法。本申请实施例与现有技术相比存在的有益效果是:本申请实施例中,可以若检测到当前视频帧的指定编辑信息,则获取所述当前视频帧中包含的目标对象,其中,所述目标对象可以认为是所想要突出显示的内容;然后,根据所述指定编辑信息和至少一个目标音频分量,对所述当前视频帧所对应的初始音频进行处理,获得目标音频,并将所述当前视频帧和所述目标音频进行关联,获得目标视频;此时,任一所述目标音频分量为一个所述目标对象在所述初始音频中所对应的音频分量,因此可以根据所述指定编辑信息,对所述初始视频中关于所述目标对象的目标音频分量等部分进行相应的调整,从而使得相应的目标音频的所达到的声音效果更贴合所述当前视频帧中所呈现的视觉效果,以提升所述目标视频的呈现效果,改善用户的体验。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本申请一实施例提供的一种视频处理方法的流程示意图;图2是本申请一实施例提供的步骤S102的一种流程示意图;图3是本申请一实施例提供的另一种视频处理方法的流程示意图;图4是本申请一实施例提供的又一种视频处理方法的流程示意图;图5是本申请一实施例提供的再一种视频处理方法的流程示意图;图6是本申请一实施例提供的获得目标音频的示例性示意图;图7是本申请一实施例提供的一种视频处理装置的结构示意图;图8是本申请一实施例提供的终端设备的结构示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。本申请实施例提供的视频处理方法可以应用于服务器、台式电脑、手机、平板电脑、可穿戴设备、车载设备、增强现实(augmentedreality,AR)/虚拟现实(virtualreality,VR)设备、笔记本电脑、超级移动个人计算机(ultra-mobilepersonalcomputer,UMPC)、上网本、个人数字助理(personaldigitalassistant,PDA)等终端设备上,本申请实施例对终端设备的具体类型不作任何限制。图1示出了本申请实施例提供的一种视频处理方法的流程图,该视频处理方法可以应用于终端设备。目前,在视频录像或者视频编辑等过程中,用户可能会调整一些视频帧,以突出呈现某个场景或者某个对象,例如,可能会调整视频帧的图像缩放倍数,从而改变视频帧的视野,或者调整对焦对象等。然而现有技术中,在调整视频帧之后,视频帧所对应的音频往往依然沿用原始的音频。可见,现有技术中没有发现在调整视频帧之后,用户从视频帧中所感知到的场景和对象之间的空间关系可能会发生了变化,但原始的音频中所呈现的声音依然是基于视频帧缩放前所呈现的空间关系所采集到的声音。因此,本文档来自技高网...

【技术保护点】
1.一种视频处理方法,其特征在于,包括:/n若检测到当前视频帧的指定编辑信息,则获取所述当前视频帧中包含的目标对象;/n根据所述指定编辑信息和至少一个目标音频分量,对所述当前视频帧所对应的初始音频进行处理,获得目标音频,其中,任一所述目标音频分量为一个所述目标对象在所述初始音频中所对应的音频分量;/n将所述当前视频帧和所述目标音频进行关联,获得目标视频。/n

【技术特征摘要】
1.一种视频处理方法,其特征在于,包括:
若检测到当前视频帧的指定编辑信息,则获取所述当前视频帧中包含的目标对象;
根据所述指定编辑信息和至少一个目标音频分量,对所述当前视频帧所对应的初始音频进行处理,获得目标音频,其中,任一所述目标音频分量为一个所述目标对象在所述初始音频中所对应的音频分量;
将所述当前视频帧和所述目标音频进行关联,获得目标视频。


2.如权利要求1所述的视频处理方法,其特征在于,在根据所述指定编辑信息和至少一个目标音频分量,对所述当前视频帧所对应的初始音频进行处理,获得目标音频之前,还包括:
将所述初始音频输入训练后的第一神经网络,获得所述训练后的第一神经网络的输出结果,所述输出结果中包括识别到的音频对象和各个音频对象所分别对应的音频分量;
将所述音频对象与所述目标对象进行比对,若存在至少一个音频对象与所述目标对象相同,则确定所述当前视频帧所对应的初始音频中,存在至少一个目标对象所对应的目标音频分量。


3.如权利要求2所述的视频处理方法,其特征在于,所述若检测到当前视频帧的指定编辑信息,则获取所述当前视频帧中包含的目标对象,包括:
通过训练后的第二神经网络对所述当前视频帧进行目标识别,获得所述当前视频帧中包含的目标对象,其中,所述第一神经网络所对应的第一训练数据集中的标签与所述第二神经网络所对应的第二训练数据集中的标签至少部分重合。


4.如权利要求1所述的视频处理方法,其特征在于,在根据所述指定编辑信息和至少一个目标音频分量,对所述当前视频帧所对应的初始音频进行处理,获得目标音频之前,包括:
根据预设的对象-频段映射表,在所述初始音频中标识各个目标对象所分别对应的目标频段,并将所述目标频段作为对应的目标对象的目标音频分量。


5.如权利要求1所述的视频处理方法,其特征在于,所述若检测到当前视频帧的指定编辑信息,则获取所述当前视频帧中包含的目标对象,包括:
若检测到所述当前视频帧的当前图像缩放倍数不满足预设条件,则将所...

【专利技术属性】
技术研发人员:崔志佳范泽华
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1