基于采样级音频多轨合成的通信网络视频直播方法及系统技术方案

技术编号：36185550 阅读：19 留言：0更新日期：2022-12-31 20:48

本发明专利技术涉及一种基于采样级音频多轨合成的通信网络视频直播方法，包括：在视频拍摄设备在录制视频信息的同时，使各音频采集设备采集音频信息；各音频采集设备将采集的音频信息打包为数据包后通过无线通信网络发送给视频拍摄设备；视频拍摄设备将接收到的各音频采集设备的数据包分别恢复为一轨音频信号，并将多轨音频信号的波形匹配对齐后合成为一轨合成音频信号；并与视频信息合成为直播视频。本发明专利技术中，通过对多轨音频信号的波形进行匹配对齐，能够对多轨音频信号进行采样级同步，同步精度远高于时钟同步，从而能够得到更好的音频合成效果。合成效果。合成效果。

全部详细技术资料下载

【技术实现步骤摘要】
基于采样级音频多轨合成的通信网络视频直播方法及系统

[0001]本专利技术属于视频直播
，涉及一种基于采样级音频多轨合成的通信网络视频直播方法及系统。

技术介绍

[0002]在视频直播时，经常需要设置多个音频采集设备在不同的位置单独进行音频采集的情况，以通过近距离的采集获得更好的音质效果，之后再对采集的音频进行合成，以达到更好的音频效果。但是对多轨音频进行合成时，一般采用调音台人工进行合成，调音人员通过自已的听觉效果对多路输入信号进行放大、混合、分配、音质修饰和音响效果加工，以达到更好的音质效果；这就对调音人员提出了很高的要求。另外，音频采集设备和视频拍摄设备通常采用有线传输或蓝牙传输的方式传输音频信息，但是有线传输的方式不便于设备的移动，且还会存在较大的损耗；蓝牙传输方式的传输速率较低，不能进行无损音频传输；另外，蓝牙传输的距离一般在10米左右，且不能进行网络延展，传输距离受限。WIFI传输方式虽然在传输速率上远超蓝牙，且可以通过网络延展大大增加传输距离，但由于WIFI传输协议的延时较长，且不可避免地存在丢包现象，用于传输音频还存在许多需要解决的问题。

技术实现思路

[0003]有鉴于此，本专利技术的目的在于提供一种基于采样级音频多轨合成的通信网络视频直播方法及系统。
[0004]为达到上述目的，本专利技术提供如下技术方案：
[0005]一种基于采样级音频多轨合成的通信网络视频直播方法，包括以下步骤：
[0006]S1、将多个音频采集设备通过无线通信网络与一视频拍摄设备...

【技术保护点】

【技术特征摘要】
1.一种基于采样级音频多轨合成的通信网络视频直播方法，其特征在于，包括以下步骤：S1、将多个音频采集设备通过无线通信网络与一视频拍摄设备连接，视频拍摄设备在录制视频信息的同时，下发指令使各音频采集设备采集音频信息；S2、各音频采集设备采集音频信息，并将音频信息打包为数据包后通过无线通信网络发送给视频拍摄设备；S3、视频拍摄设备接收到各音频采集设备的数据包后，将每一音频采集设备的数据包分别恢复为一轨音频信号，并将多轨音频信号的波形匹配对齐后，再将多轨音频信号合成为一轨合成音频信号；S4、将合成音频信号和视频信息合成为直播视频。2.根据权利要求1所述的基于采样级音频多轨合成的通信网络视频直播方法，其特征在于：在所述步骤S3中，将多轨音频信号的波形匹配对齐的方法包括以下步骤：S311、预先设置匹配周期的时长，在一个匹配周期内，选定一轨音频信号作为参考音频；S312、将另一轨音频信号的波形与参考音频的波形重叠后在预定范围内左右移动，并在每一次移动后对上述两个波形的欧几里德距离进行积分，将欧几里德距离积分值最小的位置对应的时间点作为该轨音频信号的对准时间点；S313、重复步骤S312，依次计算其他各轨音频信号的对准时间点，将各轨音频信号的对准时间点对齐。3.根据权利要求1所述的基于采样级音频多轨合成的通信网络视频直播方法，其特征在于：在所述步骤S3中，将多轨音频信号的波形匹配对齐的方法包括以下步骤：S321、预先设置匹配周期的时长，在一个匹配周期内，按音频电平值从高到低依次找出每一轨音频信号的多个峰值作为参考峰值；S322、依次将各轨音频信号对应的一个参考峰值的时间点对齐，并对此时其他各个对应的参考峰值的之间的时间点的时差进行求和；S323、找出时差之和最小时的参考峰值的时间点作为对准时间点，将各轨音频信号的对准时间点对齐。4.根据权利要求1所述的基于采样级音频多轨合成的通信网络视频直播方法，其特征在于：在所述步骤S3中，将多轨音频信号的波形匹配对齐的方法包括以下步骤：S331、预先设置匹配周期的时长，分别计算出一个匹配周期内每一轨音频信号的包络线；S332、找出每一轨音频信号的包络线的各个峰值对应的时间点；S333、依次将各轨音频信号包络线对应的一个峰值的时间点对齐，并对此时其他各个对应的包络线峰值的之间的时间点的时差进行求和；S334、找出时差之和最小时的包络线峰值的时间点作为对准时间点，将各轨音频...

【专利技术属性】
技术研发人员：丁英锋，
申请(专利权)人：深圳市野草声学有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人