一种视音频节目的导播方法、装置、设备、系统及介质制造方法及图纸

技术编号:33920195 阅读:10 留言:0更新日期:2022-06-25 20:54
本申请实施例提供一种视音频节目的导播方法、装置、设备、系统及介质,该方法包括:获取多个待导播数据,其中,所述多个待导播数据是在视音频节目制作过程中由多台视音频信号采集设备获得的,一个待导播数据包括一段音频信号和/或至少一帧图像;通过至少一个神经网络模型获取所述多个待导播数据中的人物特征,其中,所述人物特征至少用于表征所述视音频类节目中人物的行为;根据所述人物特征完成对所述视音频节目的导播。通过本申请的一些实施例能够实现视音频节目的自动导播,降低了人工成本,同时能够提升节目导播质量。同时能够提升节目导播质量。同时能够提升节目导播质量。

【技术实现步骤摘要】
一种视音频节目的导播方法、装置、设备、系统及介质


[0001]本申请实施例涉及节目导播领域,具体涉及一种视音频节目的导播方法、装置、设备、系统及介质。

技术介绍

[0002]相关技术中,视音频节目的制作和播出需要专业的导播系统和工作人员。例如,视频节目导播需要通过切换画面来完成节目的播出,具体地节目导播过程通常需要依赖工作人员手工切换画面或者视音频采集设备,导致增加了制作成本,降低了导播效率。
[0003]为了解决上述问题,相关技术中采用预先制作分镜脚本的方法来实现节目导播,由于预先制作脚本需要提前明确节目名单以及演员人数等信息,所以只能应用于单一的节目,或者,根据声源位置引导镜头拍摄,但均缺乏灵活性,不能实现视音频节目的全自动导播。
[0004]因此,如何提升视音频节目导播的灵活性成为需要解决的问题。

技术实现思路

[0005]本申请实施例提供一种视音频节目的导播方法、装置、设备、系统及介质,通过本申请的一些实施例至少能够实现自动对视音频节目进行导播,同时提升导播过程中的灵活性。
[0006]第一方面,本申请提供了一种视音频节目的导播方法,所述导播方法包括:获取多个待导播数据,其中,所述多个待导播数据是在视音频节目制作过程中由多台视音频信号采集设备获得的,一个待导播数据包括一段音频信号和/或至少一帧图像;通过至少一个神经网络模型获取所述多个待导播数据中的人物特征,其中,所述人物特征至少用于表征所述视音频类节目中人物的行为;根据所述人物特征完成对所述视音频节目的导播。
[0007]因此,区别于相关技术中使用预设脚本进行节目导播,本申请实施例通过至少一个神经网络模型获取多个待导播数据中的人物特征能够实现视音频节目的自动导播,降低了人工成本,提升节目导播质量,同时,由于本申请无需预设脚本,因此提升了导播的灵活性。
[0008]结合第一方面,在本申请的一种实施方式中,所述根据所述人物特征完成对所述视音频节目的导播,包括:根据所述人物特征控制所述视音频信号采集设备获取新的待导播数据。
[0009]因此,本申请实施例通过根据人物特征控制视音频信号采集设备获取新的待导播数据,能够获得质量更好的待导播数据,从而提升导播质量和效率。
[0010]结合第一方面,在本申请的一种实施方式中,所述多个待导播数据为多帧图像,所述多帧图像中的至少一帧图像包括目标人物,所述至少一个神经网络模型包括行为跟踪网络;其中,所述通过至少一个神经网络模型获取所述多个待导播数据中的人物特征,包括:将所述多帧图像输入所述行为跟踪网络;通过所述行为跟踪网络确定所述目标人物处于移
动状态,其中,所述人物特征包括所述目标人物处于移动状态;所述根据所述人物特征控制所述视音频信号采集设备获取新的待导播数据,包括:控制目标视音频信号采集设备对所述目标人物进行跟随拍摄,获取所述新的待导播数据。
[0011]因此,本申请实施例通过识别目标人物处于移动状态,控制目标视音频信号采集设备对目标人物进行跟踪拍摄,能够使目标人物始终保持在画面中间,从而提升导播质量。
[0012]结合第一方面,在本申请的一种实施方式中,所述至少一个神经网络模型包括人脸检测网络;其中,所述通过至少一个神经网络模型获取所述多个待导播数据中的人物特征,包括:将所述多帧图像输入所述人脸检测网络;通过所述人脸检测网络确定所述目标人物的数量,其中,所述人物特征包括所述目标人物的数量;所述根据所述人物特征控制所述视音频信号采集设备获取新的待导播数据,包括:控制目标视音频信号采集设备根据所述目标人物的数量,获取新的待导播数据。
[0013]因此,本申请实施例通过目标人物的数量,能够控制目标视音频信号采集设备的拍摄方式,从而能够是获取质量更高的新的待导播数据。
[0014]结合第一方面,在本申请的一种实施方式中,所述至少一个神经网络模型包括行为识别网络;其中,所述通过至少一个神经网络模型获取所述多个待导播数据中的人物特征,包括:将所述多帧图像输入所述行为识别网络;通过所述行为识别网络确定所述目标人物的行为,其中,所述人物特征包括所述目标人物的行为;所述根据所述人物特征控制所述视音频信号采集设备获取新的待导播数据,包括:控制目标视音频信号采集设备根据所述目标人物的行为,获取新的待导播数据。
[0015]因此,本申请实施例通过识别目标人物的行为,能够根据行为类型的不同,选择更适合该行为类型的目标视音频信号采集设备进行拍摄,从而能够提升导播质量。
[0016]结合第一方面,在本申请的一种实施方式中,所述多个待导播数据为多段音频数据,所述至少一个神经网络模型包括语义识别网络,其中,所述通过至少一个神经网络模型获取所述多个待导播数据中的人物特征,包括:将所述多段音频数据输入所述语义识别网络;通过所述语义识别网络确定所述多段音频数据的语义,其中,所述人物特征包括所述多段音频数据的语义;所述根据所述人物特征控制所述视音频信号采集设备获取新的待导播数据,包括:控制目标视音频信号采集设备根据所述语义,获取新的待导播数据。
[0017]因此,本申请实施例通过识别多段音频数据语义,能够对视音频节目中的每个节目类型进行识别,从而能够根据每个节目类型调整目标视音频信号采集设备的拍摄方式,从而能够提升导播的效率和质量。
[0018]结合第一方面,在本申请的一种实施方式中,所述根据所述人物特征完成对所述视音频节目的导播,包括:根据所述人物特征,确定所述多台视音频信号采集设备中各视音频信号采集设备所对应的权重;依据所述权重从所述多个待导播数据中选择目标待导播数据进行播出。
[0019]因此,本申请实施例通过从多个待导播数据中选择出目标待导播数据进行切换,能够防止同一待导播数据长时间播放,减小画面单调的情况,同时,还能够实现自动的切换画面,提升导播的灵活性,从而提升导播的效率和质量。
[0020]第二方面,本申请提供了一种视音频节目的导播装置,所述导播装置包括:数据获取模块,被配置为获取多个待导播数据,其中,所述多个待导播数据是在视音频节目制作过
程中由多台视音频信号采集设备获得的,一个待导播数据包括一段音频信号和/或至少一帧图像;特征识别模块,被配置为通过至少一个神经网络模型获取所述多个待导播数据中的人物特征,其中,所述人物特征至少用于表征所述视音频类节目中人物的行为;导播模块,被配置为根据所述人物特征完成对所述视音频节目的导播。
[0021]结合第二方面,在本申请的一种实施方式中,所述导播模块还被配置为:根据所述人物特征控制所述视音频信号采集设备获取新的待导播数据。
[0022]结合第二方面,在本申请的一种实施方式中,所述多个待导播数据为多帧图像,所述多帧图像中的至少一帧图像包括目标人物,所述至少一个神经网络模型包括行为跟踪网络;其中,所述特征识别模块还被配置为:将所述多帧图像输入所述行为跟踪网络;通过所述行为跟踪网络确定所述目标人物处于移动状态,其中,所述人物特征包括所述目标人物处于移动状态;所述导本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视音频节目的导播方法,其特征在于,所述导播方法包括:获取多个待导播数据,其中,所述多个待导播数据是在视音频节目制作过程中由多台视音频信号采集设备获得的,一个待导播数据包括一段音频信号和/或至少一帧图像;通过至少一个神经网络模型获取所述多个待导播数据中的人物特征,其中,所述人物特征至少用于表征所述视音频节目中人物的行为;根据所述人物特征完成对所述视音频节目的导播。2.根据权利要求1所述的方法,其特征在于,所述根据所述人物特征完成对所述视音频节目的导播,包括:根据所述人物特征控制所述视音频信号采集设备获取新的待导播数据。3.根据权利要求2所述的方法,其特征在于,所述多个待导播数据为多帧图像,所述多帧图像中的至少一帧图像包括目标人物,所述至少一个神经网络模型包括行为跟踪网络;其中,所述通过至少一个神经网络模型获取所述多个待导播数据中的人物特征,包括:将所述多帧图像输入所述行为跟踪网络;通过所述行为跟踪网络确定所述目标人物处于移动状态,其中,所述人物特征包括所述目标人物处于移动状态;所述根据所述人物特征控制所述视音频信号采集设备获取新的待导播数据,包括:控制目标视音频信号采集设备对所述目标人物进行跟随拍摄,获取所述新的待导播数据。4.根据权利要求3所述的方法,其特征在于,所述至少一个神经网络模型包括人脸检测网络;其中,所述通过至少一个神经网络模型获取所述多个待导播数据中的人物特征,包括:将所述多帧图像输入所述人脸检测网络;通过所述人脸检测网络确定所述目标人物的数量,其中,所述人物特征包括所述目标人物的数量;所述根据所述人物特征控制所述视音频信号采集设备获取新的待导播数据,包括:控制目标视音频信号采集设备根据所述目标人物的数量,获取新的待导播数据。5.根据权利要求4所述的方法,其特征在于,所述至少一个神经网络模型包括行为识别网络;其中,所述通过至少一个神经网络模型获取所述多个待导播数据中的人物特征,包括:将所述多帧图像输入所述行为识别网络;通过所述行为识别网络确定所述目标人物的行为,其中,所述人物特征包括所述目标人物的行为;所述根据所述人物特征控制所述视音频信号采集设备获取新的待导播数据,包括:控制目标视音频信号采集设备根据所述目标人物的行为,获取新的待导播数据。6.根据权利要求1

5任一项所述的方法,其特征在于...

【专利技术属性】
技术研发人员:窦阳超石业瀚刘海鹏韩春
申请(专利权)人:华创高科北京技术有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1