视频合成控制方法、装置及相应的终端制造方法及图纸

技术编号:17784675 阅读:39 留言:0更新日期:2018-04-22 16:28
本发明专利技术涉及软件应用领域,具体涉及一种视频合成控制方法、装置及相应的终端,所述方法包括:获取多路源视频流;接收用户对每一路源视频流配置的图像及音频的控制按钮的选择指令,设置每一路源视频流的控制按钮;根据设置的控制按钮处理每一路源视频流,得到各待合成图像和待合成音频;对所述待合成图像和待合成音频进行处理,得到合成视频流。本发明专利技术通过对多路源视频流配置图像及音频的控制按钮,用户只需对各路视频流的控制按钮进行选择即可选择相应的源视频流的图像或音频,然后得到合成视频流,满足简单场景下音频跟随视频的切换需求及复杂场景下静音某源视频流或者强制输出某源视频流的声音,提高了操作便利性,节约了节目制作成本。

【技术实现步骤摘要】
视频合成控制方法、装置及相应的终端
本专利技术涉及软件应用领域,具体涉及一种视频合成控制方法、装置及相应的终端。
技术介绍
随着互联网技术的快速发展,各类视频直播越来越受观众的喜爱,传统的基于广电设备的节目直播,在现场布置有视频切换台和音频调音台,分别由不同的操作人员进行视频画面切换和音频信号合成,生成最终的节目信号,这种方案设备成本和使用门槛都比较高,难以在当下的网联网直播行业中推广使用;在互联网直播行业,目前主要是基于电脑的软件切换台/导播软件,一般都集成了视频切换和音频调音的功能,对视频切换和音频切换做简单的功能堆砌,其操作方式比较繁琐,例如导演在切换画面后,需要手动的选择新的音频信号,音频信号不能跟随视频信号进行联动,还需要单独的控制,切换时操作比较繁琐,对用户的使用有较高的要求,一旦用户操作不及时,就会出现视频和声音不匹配的情况。因而,对于互联网直播行业亟需一种更加简便操作的音视频处理解方案。
技术实现思路
本专利技术的目的在于提供一种视频合成控制方法、装置及相应的终端,解决目前视频合成控制操作繁琐、复杂的问题。为实现该目的,本专利技术采用如下技术方案:第一方面,本专利技术提供了一种视频合成控制方法,其特征在于,包括:获取多路源视频流;接收用户对每一路源视频流配置的图像及音频的控制按钮的选择指令,设置每一路源视频流的控制按钮,所述控制按钮包括静音按钮和全局音按钮;根据设置的控制按钮处理每一路源视频流,其中,当选择静音按钮且不选择全局音按钮时,将对应的源视频流的图像作为待合成图像;当选择全局音按钮且不选择静音按钮时,将对应的源视频流的音频作为待合成音频;当不选择静音按钮和全局音按钮时,将对应的源视频流的图像作为待合成图像、音频作为待合成音频;当选择静音按钮和全局音按钮,将对应的源视频流不作合成处理;对所述待合成图像和待合成音频进行处理,得到合成视频流。进一步的,所述对所述待合成图像和待合成音频进行处理,得到合成视频流,包括:获取各路源视频流的待合成图像,将所述待合成图像按照预设布局进行合成;获取各路源视频流中的待合成音频,将所述待合成音频叠加合成;输出合成视频流。具体的,所述获取各路源视频流中的待合成音频,将所述待合成音频叠加合成,包括:获取各路源视频流的待合成音频及各待合成音频的音量大小,将各待合成音频按照各自的音量大小叠加合成。进一步的,所述获取多路源视频流之后,还包括:检测源视频流是否出现异常;当源视频流出现异常的持续时长大于预置值或当源视频流在预设时间段内出现异常的次数大于预置值时,将所述出现异常的源视频流暂时设置为选择静音按钮。更进一步的,所述将所述出现异常的源视频流暂时设置为选择静音按钮之后,还包括:检测出现异常的源视频流是否恢复正常;当所述源视频流恢复正常的持续时长大于预置值时,还原所述源视频流的控制按钮选择。进一步的,所述获取多路源视频流之后,还包括:将其中一路源视频流作为主屏源视频流,并将所述主屏源视频流默认设置为不选择静音按钮和全局音按钮,将除主屏源视频流外的其它源视频流默认设置为选择静音按钮且不选择全局音按钮。具体的,所述将其中一路源视频流作为主屏源视频流之后,还包括:检测主屏源视频流是否出现异常;当主屏源视频流出现异常时,根据除主屏源视频流外的其它源视频流的排序逐路检测所述其它源视频流是否正常;获取排在最前面的检测正常的源视频流,将所述最前面的检测正常的源视频流作为主屏视频流;把所述最前面的检测正常的源视频流暂时设置为不选择静音按钮。进一步的,所述方法还包括:检测原始主屏源视频流是否恢复正常;当原始主屏源视频流恢复正常的持续时长大于预置值时,将恢复正常的原始主屏源视频流作为主屏源视频流;将所述最前面的检测正常的源视频流设置为选择静音按钮。第二方面,本专利技术提供一种视频合成控制装置,所述装置存储有多条指令,所述指令适于由处理器加载并执行:获取多路源视频流;接收用户对每一路源视频流配置的图像及音频的控制按钮的选择指令,设置每一路源视频流的控制按钮,所述控制按钮包括静音按钮和全局音按钮;根据设置的控制按钮处理每一路源视频流,其中,当选择静音按钮且不选择全局音按钮时,将对应的源视频流的图像作为待合成图像;当选择全局音按钮且不选择静音按钮时,将对应的源视频流的音频作为待合成音频;当不选择静音按钮和全局音按钮时,将对应的源视频流的图像作为待合成图像、音频作为待合成音频;当选择静音按钮和全局音按钮,将对应的源视频流不作合成处理;对所述待合成图像和待合成音频进行处理,得到合成视频流。第三方面,本专利技术提供一种终端,包括:一个或多个处理器;存储器;一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个应用程序配置用于实现第一方面所述的视频合成控制方法。与现有技术相比,本专利技术具备如下优点:本专利技术通过对多路源视频流配置图像及音频的控制按钮,用户只需对各路视频流的控制按钮进行选择即可选择相应的源视频流的图像或音频,然后合成相应的合成视频流,既能满足简单场景下音频跟随视频的切换需求,又能满足复杂场景下静音某些源视频流的声音或者强制输出某些源视频流的声音,即可在切换视频的同时,灵活高效的进行音频切换,无需额外的音频调音设备,无需额外的设备操纵人员,提高了操作便利性,节约了节目制作成本。同时,本专利技术通过设置主屏源视频流及将各源视频流的图像按照预设布局进行合成,并且设置各源视频流的音频音量大小后将音频叠加合成,更好地表达各源视频流的主次,为用户提供更好的合成视频。再者,本专利技术还实时检测源视频流的异常情况,当源视频流出现异常时,将该源视频流自动强制选择静音按钮,避免出现异常的源视频流杂音的干扰,若出现异常的为主屏源视频流,用其它正常的源视频流暂时替换为主屏源视频流,并主动打开声音,以免影响直播效果。显然,上述有关本专利技术优点的描述是概括性的,更多的优点描述将体现在后续的实施例揭示中,以及,本领域技术人员也可以本专利技术所揭示的内容合理地发现本专利技术的其他诸多优点。本专利技术附加的方面和优点将在下面的描述中给出,并且本专利技术的优点将在下面的描述中变得明显或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为本专利技术的视频合成控制方法的一实施例流程示意图;图2为本专利技术执行视频合成控制方法的客户端的用户界面示例图;图3为本专利技术视频合成控制方法的另一实施例流程示意图;图4为本专利技术视频合成控制装置的一实施例示意图;图5为本专利技术实施例的终端部分结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能解释为对本专利技术的限制。本
技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本专利技术的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作。本
技术人员可以理解,除非另外定义,这里使用的所有术语(本文档来自技高网
...
视频合成控制方法、装置及相应的终端

【技术保护点】
一种视频合成控制方法,其特征在于,包括:获取多路源视频流;接收用户对每一路源视频流配置的图像及音频的控制按钮的选择指令,设置每一路源视频流的控制按钮,所述控制按钮包括静音按钮和全局音按钮;根据设置的控制按钮处理每一路源视频流,其中,当选择静音按钮且不选择全局音按钮时,将对应的源视频流的图像作为待合成图像;当选择全局音按钮且不选择静音按钮时,将对应的源视频流的音频作为待合成音频;当不选择静音按钮和全局音按钮时,将对应的源视频流的图像作为待合成图像、音频作为待合成音频;当选择静音按钮和全局音按钮,将对应的源视频流不作合成处理;对所述待合成图像和待合成音频进行处理,得到合成视频流。

【技术特征摘要】
1.一种视频合成控制方法,其特征在于,包括:获取多路源视频流;接收用户对每一路源视频流配置的图像及音频的控制按钮的选择指令,设置每一路源视频流的控制按钮,所述控制按钮包括静音按钮和全局音按钮;根据设置的控制按钮处理每一路源视频流,其中,当选择静音按钮且不选择全局音按钮时,将对应的源视频流的图像作为待合成图像;当选择全局音按钮且不选择静音按钮时,将对应的源视频流的音频作为待合成音频;当不选择静音按钮和全局音按钮时,将对应的源视频流的图像作为待合成图像、音频作为待合成音频;当选择静音按钮和全局音按钮,将对应的源视频流不作合成处理;对所述待合成图像和待合成音频进行处理,得到合成视频流。2.根据权利要求1所述的方法,其特征在于,所述对所述待合成图像和待合成音频进行处理,得到合成视频流,包括:获取各路源视频流的待合成图像,将所述待合成图像按照预设布局进行合成;获取各路源视频流中的待合成音频,将所述待合成音频叠加合成;输出合成视频流。3.根据权利要求2所述的方法,其特征在于,所述获取各路源视频流中的待合成音频,将所述待合成音频叠加合成,包括:获取各路源视频流的待合成音频及各待合成音频的音量大小,将各待合成音频按照各自的音量大小叠加合成。4.根据权利要求1所述的方法,其特征在于,所述获取多路源视频流之后,还包括:检测源视频流是否出现异常;当源视频流出现异常的持续时长大于预置值或当源视频流在预设时间段内出现异常的次数大于预置值时,将所述出现异常的源视频流暂时设置为选择静音按钮。5.根据权利要求4所述的方法,其特征在于,所述将所述出现异常的源视频流暂时设置为选择静音按钮之后,还包括:检测出现异常的源视频流是否恢复正常;当所述源视频流恢复正常的持续时长大于预置值时,还原所述源视频流的控制按钮选择。6.根据权利要求1所述的方法,其特征在于,所述获取多路源视频流之后,还包括:将其中一路源视频流作为主屏源视频流,...

【专利技术属性】
技术研发人员:王云
申请(专利权)人:广州华多网络科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1