音频处理设备、方法及计算机可读存储介质技术

技术编号:29794380 阅读:13 留言:0更新日期:2021-08-24 18:14
本申请涉及音频处理技术领域,特别是涉及音频处理设备、方法及计算机可读存储介质。该方法包括:获取多路音频信号;将多路音频信号进行加权求和,得到混音后的目标音频信号;其中,每一路音频信号对应的第一加权系数是根据指数平滑算法计算得到;输出目标音频信号。通过上述方式,能够提高用户体验。

【技术实现步骤摘要】
音频处理设备、方法及计算机可读存储介质
本申请涉及音频处理
,特别是涉及音频处理设备、方法及计算机可读存储介质。
技术介绍
在视频会议中,音频的交互处于最基本和最核心的部分,当不同地点的多个终端需要进行实时音频交互时,需要将其中两路或两路以上的音频按照一定的策略进行混合,提供给听者。因此音频混音的质量对用户的实际体验效果有直接影响,是多路音频交互的核心问题。当前各类混音算法的重点都是尽量能够在混音后保持原始的音频线性叠加,同时解决数据叠加后的溢出。这种混音的思路虽然保持了各路输入音频的原始音量,但是从用户的实际体验效果来看存在以下问题:1、混音后音量起伏明显,听者对内容的感知下降。2、多路声音线性的混在同一个声音通道时,缺乏指向性和集中性,对沟通的内容无法专注。由此可见,现有的混音方法并不能很好的解决用户体验问题。
技术实现思路
本申请主要解决的技术问题是提供音频处理设备、方法及计算机可读存储介质,能够提高用户体验。本申请采用的一种技术方案是提供一种音频处理方法,该音频处理方法包括:获取多路音频信号;将多路音频信号进行加权求和,得到混音后的目标音频信号;其中,每一路音频信号对应的第一加权系数是根据指数平滑算法计算得到;输出所述目标音频信号。其中,将多路音频信号进行加权求和,得到混音后的目标音频信号,包括:对每一路音频信号进行采样分帧处理,得到每一路音频信号对应的连续的音频帧信号;获取每一路音频信号中的同一时段对应的音频帧信号;计算同一时段对应的音频帧信号的能量总数;计算每一音频帧信号的能量与所述能量总数的占比;基于所述占比得到每一路音频信号对应的第一加权系数;利用所述第一加权系数与每一路音频帧信号进行加权求和,得到混音后的目标音频信号。其中,基于所述占比得到每一路音频信号对应的第一加权系数,包括:利用所述占比和时间平滑系数得到第一数值;利用所述时间平滑系数和上一时段的音频帧信号对应的第一加权系数得到第二数值;利用所述第二数值和所述第一数值得到所述第一加权系数。其中,利用所述占比和时间平滑系数得到第一数值,包括:利用以下公式计算得到所述第一数值:A=σ*B;其中,A表示所述第一数值,σ表示时间平滑系数;B表示所述占比;所述利用所述时间平滑系数和上一时段的音频帧信号对应的第一加权系数得到第二数值,包括:利用以下公式计算得到所述第二数值:C=(1-σ)*D;其中,C表示所述第二数值,D表示上一时段的音频帧信号对应的第一加权系数。其中,对每一路音频信号进行采样分帧处理,得到每一路音频信号对应的连续的音频帧信号,包括:利用预设采样周期对每一路音频信号进行采样处理,得到多个连续的采样音频信号;将多个连续的采样音频信号按照预设时间间隔组成音频集合,将所述音频集合作为所述音频帧信号。其中,计算同一时段对应的音频帧信号的能量总数,包括:对每一所述音频帧信号中的采样音频信号进行平方求和处理,得到所述音频帧信号的能量;计算同一时段所有的音频帧信号的能量总数。其中,基于所述占比得到每一路音频帧信号对应的第一加权系数,包括:利用以下公式计算所述第一加权系数:其中,ωNm表示第N路音频的第m帧信号对应的第一加权系数,σ表示时间平滑系数,S1m(n)表示第一路音频的第m帧信号,S2m(n)表示第二路音频的第m帧信号,SNm(n)表示第N路音频的第m帧信号,表示SNm(n)的平方和,表示S2m(n)的平方和,表示S1m(n)的平方和,n表示所述音频帧信号中的所述采样音频信号的数量,ωNm-1表示第N路音频的第m-1帧信号对应的第一加权系数。本申请采用的另一种技术方案是提供一种音频处理设备,该音频处理设备包括:获取模块,用于获取多路音频信号;处理模块,用于将多路音频信号进行加权求和,得到混音后的目标音频信号;其中,每一路音频信号对应的第一加权系数是根据指数平滑算法计算得到;输出模块,用于输出目标音频信号。本申请采用的另一种技术方案是提供一种音频处理设备,该音频处理设备包括处理器以及与处理器连接的存储器;存储器用于存储程序数据,程序数据在被处理器执行时,用于实现如上述技术方案提供的方法。本申请采用的另一种技术方案是提供一种计算机可读存储介质,该计算机可读存储介质用于存储程序数据,程序数据在被处理器执行时,用于实现如上述技术方案提供的方法。本申请的有益效果是:区别于现有技术的情况,本申请提供的音频处理设备、方法及计算机可读存储介质。利用指数平滑算法计算得到每一路音频信号对应的第一加权系数,并利用第一加权系数进行加权求和,得到混音后的目标音频信号,一方面不论多少路音频信号的叠加,其幅值不会超过输入音频信息的最大值,不会产生溢出;另一方面,多路音频信号中音量较大的一路将保持较好的辨识度,其它路也能较好的充当背景声音,能够提高用户体验;另一方面,输出的目标音频信号中声音起伏较平稳,不会产生说话人一多声音就嘈杂的效果。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。其中:图1是本申请提供的音频处理方法一实施例的流程示意图;图2是本申请提供的音频处理方法另一实施例的流程示意图;图3是本申请提供的音频采样分帧示意图;图4是本申请提供的步骤26的流程示意图;图5为本申请提供的音频处理设备一实施例的结构示意图;图6为本申请提供的音频处理设备另一实施例的结构示意图;图7为本申请提供的计算机可读存储介质一实施例的结构示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。可以理解的是,此处所描述的具体实施例仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。参阅图1,图1是本申请提供的音频处理方法一实施例的流程示意图。该方法包括:步骤11:获取多路音频信号。在本实施例中,每一路音频信号可以是由不同的音频采集设备采集得到。如在多方会议场景中,每一路音频信号可以是由参会方的移动设备采集得到。如手机或电脑上的麦克风。可以理解,多路音频信号至少为两路。步骤12:将多路音频信号进行加权求和,得到混音后的目标音频信号本文档来自技高网...

【技术保护点】
1.一种音频处理方法,其特征在于,所述音频处理方法包括:/n获取多路音频信号;/n将多路音频信号进行加权求和,得到混音后的目标音频信号;其中,每一路音频信号对应的第一加权系数是根据指数平滑算法计算得到;/n输出所述目标音频信号。/n

【技术特征摘要】
1.一种音频处理方法,其特征在于,所述音频处理方法包括:
获取多路音频信号;
将多路音频信号进行加权求和,得到混音后的目标音频信号;其中,每一路音频信号对应的第一加权系数是根据指数平滑算法计算得到;
输出所述目标音频信号。


2.根据权利要求1所述的音频处理方法,其特征在于,
所述将多路音频信号进行加权求和,得到混音后的目标音频信号,包括:
对每一路音频信号进行采样分帧处理,得到每一路音频信号对应的连续的音频帧信号;
获取每一路音频信号中的同一时段对应的音频帧信号;
计算同一时段对应的音频帧信号的能量总数;
计算每一音频帧信号的能量与所述能量总数的占比;
基于所述占比得到每一路音频信号对应的第一加权系数;
利用所述第一加权系数与每一路音频帧信号进行加权求和,得到混音后的目标音频信号。


3.根据权利要求2所述的音频处理方法,其特征在于,
所述基于所述占比得到每一路音频信号对应的第一加权系数,包括:
利用所述占比和时间平滑系数得到第一数值;
利用所述时间平滑系数和上一时段的音频帧信号对应的第一加权系数得到第二数值;
利用所述第二数值和所述第一数值得到所述第一加权系数。


4.根据权利要求3所述的音频处理方法,其特征在于,
所述利用所述占比和时间平滑系数得到第一数值,包括:
利用以下公式计算得到所述第一数值:
A=σ*B;其中,A表示所述第一数值,σ表示时间平滑系数;B表示所述占比;
所述利用所述时间平滑系数和上一时段的音频帧信号对应的第一加权系数得到第二数值,包括:
利用以下公式计算得到所述第二数值:
C=(1-σ)*D;其中,C表示所述第二数值,D表示上一时段的音频帧信号对应的第一加权系数。


5.根据权利要求2所述的音频处理方法,其特征在于,
所述对每一路音频信号进行采样分帧处理,得到每一路音频信号对应的连续的音频帧信号,包括:
利用预设采...

【专利技术属性】
技术研发人员:李晶晶郭素霞
申请(专利权)人:深圳市健成云视科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1