一种基于ARM平台的多路混音方法技术

技术编号：33890024 阅读：7 留言：0更新日期：2022-06-22 17:24

本发明专利技术公开了一种基于ARM平台的多路混音方法，属于语音处理领域。该方法从网口接收语音数据包到拆包得到语音净荷，再到多路混音，再到混音完成后发送回终端，完整地解决了音频或音视频会议中音频的处理流程。同时，本发明专利技术创造性地运用了自适应加权混音算法，并基于ARM汇编指令进行基本数学运算，从而大大改善了混音后色声音质量，并提高了运行效率，显著降低了对处理器的性能要求。降低了对处理器的性能要求。降低了对处理器的性能要求。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于ARM平台的多路混音方法

[0001]本专利技术属于语音处理
，具体来说是一种基于ARM平台实现的针对音频会议或音视频会议的多路混音方法。

技术介绍

[0002]当今社会对音频会议系统或者音视频会议系统的应用需求越来越高，此类会议的渐渐显示出以下特点：
[0003]1)会议规模越来越大，参会人数动辄达两位数甚至更多；
[0004]2)会议服务器越来越小型化、便携化、嵌入式化。
[0005]针对以上特点，音频会议系统或音视频会议系统对混音软件的需求也越来越高，即保证多人参会的情况下语音质量良好，混音算法的运行效率要高，对服务器处理器的性能要求越低越好。音频会议或者音视频会议系统中存在多路语音混音的需求，而且参会人数越多对混音算法的运行效率及处理器的性能要求越高。
[0006]目前，混音算法一般有以下几种：
[0007]1)线性叠加并箝位法，即将每一路的语音数据线性叠加后进行溢出检测，如果溢出，以最大值来替代。这样会造成声音波形的人为削峰，在破坏语音信号特性的同时会促使噪音的产生。
[0008]2)归一化法，即将每一路的的语音数据线性叠加后全部乘一个系数因子，使幅值归一化，带来的弊端是声音波形生硬，不平滑，声音质量失真度较大。

技术实现思路

[0009]本专利技术的目的是解决嵌入式平台中多路混音算法难以实际应用的问题，提供一种针对音频会议或音视频会议的多路混音方法。该方法能够实现基于中端ARM平台的多路(至少十路)混音。
[0010]为...

【技术保护点】

【技术特征摘要】
1.一种基于ARM平台的多路混音方法，其特征在于，包括以下步骤：(1)确定混音路数，依据混音路数初始化FIFO音频数据预存栈，FIFO音频数据预存栈具有与混音路数相等的通道数；然后，启动定时器，同时创建并启动混音线程；(2)从网口接收音频数据并拆包，得到音频净荷数据；依据音频净荷数据的特征确定数据的路数，然后依据路数将数据预存至FIFO音频数据预存栈的相应通道中；(3)定时器的每个周期中，混音线程从FIFO音频数据预存栈的各通道中取数一次，基于ARM汇编指令进行自适应加权混音运算；自适应加权混音运算的方式为，使用一个可变的衰减因子对语音进行衰减，这个衰减因子也就代表语音的权重；当混音数据溢出时，衰减因子减小，使得溢出的数据在衰减后能够处于临界值以内；在混音数据没有溢出时，衰减因子增大，使数据平缓变化；(4)混音完成后进行净荷数据打包，并经由网口发送回语音终端。2.根据权利要求1所述的一种基于ARM平台的多路混音方法，其特征在于，步骤(3)中基于ARM汇编指令...

【专利技术属性】
技术研发人员：张敬辉，王志浩，董彦磊，
申请(专利权)人：中国电子科技集团公司第五十四研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人