音频处理设备、方法及计算机可读存储介质技术

技术编号：29794380 阅读：13 留言：0更新日期：2021-08-24 18:14

本申请涉及音频处理技术领域，特别是涉及音频处理设备、方法及计算机可读存储介质。该方法包括：获取多路音频信号；将多路音频信号进行加权求和，得到混音后的目标音频信号；其中，每一路音频信号对应的第一加权系数是根据指数平滑算法计算得到；输出目标音频信号。通过上述方式，能够提高用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
音频处理设备、方法及计算机可读存储介质
本申请涉及音频处理
，特别是涉及音频处理设备、方法及计算机可读存储介质。
技术介绍
在视频会议中，音频的交互处于最基本和最核心的部分，当不同地点的多个终端需要进行实时音频交互时，需要将其中两路或两路以上的音频按照一定的策略进行混合，提供给听者。因此音频混音的质量对用户的实际体验效果有直接影响，是多路音频交互的核心问题。当前各类混音算法的重点都是尽量能够在混音后保持原始的音频线性叠加，同时解决数据叠加后的溢出。这种混音的思路虽然保持了各路输入音频的原始音量，但是从用户的实际体验效果来看存在以下问题：1、混音后音量起伏明显，听者对内容的感知下降。2、多路声音线性的混在同一个声音通道时，缺乏指向性和集中性，对沟通的内容无法专注。由此可见，现有的混音方法并不能很好的解决用户体验问题。
技术实现思路
本申请主要解决的技术问题是提供音频处理设备、方法及计算机可读存储介质，能够提高用户体验。本申请采用的一种技术方案是提供一种音频处理方法，该音频处理方法包括：获取多路音频信号；将多路音频信号进行加权求和，得到混音后的目标音频信号；其中，每一路音频信号对应的第一加权系数是根据指数平滑算法计算得到；输出所述目标音频信号。其中，将多路音频信号进行加权求和，得到混音后的目标音频信号，包括：对每一路音频信号进行采样分帧处理，得到每一路音频信号对应的连续的音频帧信号；获取每一路音频信号中的同一时段对应的音频帧信号；计算同一时...

【技术保护点】
1.一种音频处理方法，其特征在于，所述音频处理方法包括：/n获取多路音频信号；/n将多路音频信号进行加权求和，得到混音后的目标音频信号；其中，每一路音频信号对应的第一加权系数是根据指数平滑算法计算得到；/n输出所述目标音频信号。/n

【技术特征摘要】
1.一种音频处理方法，其特征在于，所述音频处理方法包括：
获取多路音频信号；
将多路音频信号进行加权求和，得到混音后的目标音频信号；其中，每一路音频信号对应的第一加权系数是根据指数平滑算法计算得到；
输出所述目标音频信号。

2.根据权利要求1所述的音频处理方法，其特征在于，
所述将多路音频信号进行加权求和，得到混音后的目标音频信号，包括：
对每一路音频信号进行采样分帧处理，得到每一路音频信号对应的连续的音频帧信号；
获取每一路音频信号中的同一时段对应的音频帧信号；
计算同一时段对应的音频帧信号的能量总数；
计算每一音频帧信号的能量与所述能量总数的占比；
基于所述占比得到每一路音频信号对应的第一加权系数；
利用所述第一加权系数与每一路音频帧信号进行加权求和，得到混音后的目标音频信号。

3.根据权利要求2所述的音频处理方法，其特征在于，
所述基于所述占比得到每一路音频信号对应的第一加权系数，包括：
利用所述占比和时间平滑系数得到第一数值；
利用所述时间平滑系数和上一时段的音频帧信号对应的第一加权系数得到第二数值；
利用所述第二数值和所述第一数值得到所述第一加权系数。

4.根据权利要求3所述的音频处理方法，其特征在于，
所述利用所述占比和时间平滑系数得到第一数值，包括:
利用以下公式计算得到所述第一数值：
A＝σ*B；其中，A表示所述第一数值，σ表示时间平滑系数；B表示所述占比；
所述利用所述时间平滑系数和上一时段的音频帧信号对应的第一加权系数得到第二数值，包括：
利用以下公式计算得到所述第二数值：
C＝(1-σ)*D；其中，C表示所述第二数值，D表示上一时段的音频帧信号对应的第一加权系数。

5.根据权利要求2所述的音频处理方法，其特征在于，
所述对每一路音频信号进行采样分帧处理，得到每一路音频信号对应的连续的音频帧信号，包括：
利用预设采...

【专利技术属性】
技术研发人员：李晶晶，郭素霞，
申请(专利权)人：深圳市健成云视科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人