本申请公开了一种LC3音频混合方法、装置及存储介质,属于音频合成领域。该方法主要包括,将混音服务器接收到的多路LC3音频码流分别根据标准LC3解码步骤进行半解码得到低延迟改进型离散余弦反变换之前的每一路LC3音频码流的频谱系数;将低延迟改进型离散余弦反变换之前每一路LC3码流的频谱系数进行叠加得到混合频谱系数;以及,对混合频谱系数根据标准LC3解码步骤继续进行解码得到混合PCM音频数据。本申请在低延迟改进型离散余弦反变换之前在频域对多路LC3音频码流的频谱系数进行混合,能够在确保语音可懂度的前提下降低混音服务器的算力需求。器的算力需求。器的算力需求。
【技术实现步骤摘要】
一种LC3音频混合方法、装置及存储介质
[0001]本申请涉及音频合成
,特别涉及一种LC3音频混合方法、装置及存储介质。
技术介绍
[0002]目前主流的蓝牙音频编码器中,“子带编码技术(SBC)”是使用最为广泛,是所有的蓝牙音频设备必须支持的,但音质一般;“高级音频编码技术(AAC
‑
LC)”音质较好且应用较为广泛,很多主流的手机都支持,但是其内存占用较大,且运算复杂度高,很多蓝牙设备都基于嵌入式平台,电池容量有限,处理器运算能力较差且内存有限;“高通蓝牙音频编码技术(aptX系列)”和“索尼蓝牙音频编码技术(LDAC)”,音质较好但是码率很高,且其分别为高通和索尼独有技术,较为封闭。基于上述原因,蓝牙国际联盟联合众多厂商推出了LC3,其具有较低延迟、较高音质和编码增益以及在蓝牙领域无专利费得优点,受到广大厂商的关注。
[0003]随着LC3编解码器的大规模商用,其在会议电话中得到了广泛的应用,通常的混音方案如图1所示,假设混音服务器需要对三路音频混音(实际应用时混音的路数取决于具体的场景,本申请不做限制),先对接收到的三路LC3码流(s1,s2,s3)进行解码,得到三路音频PCM信号(x1,x2,x3),进行混音得到xmix,最后进行饱和处理得到输出信号x。
[0004]会议电话的混音通常有集中式和分布式两种方式,以集中式为例,现有技术中的解码、混音和饱和处理都需要在混音服务器中处理,随着音频路数的增多,给混音服务器的算力提出较高的需求。
技术实现思路
[0005]针对现有技术存在的问题,本申请主要提供一种LC3音频混合方法、装置及存储介质,在低延迟改进型离散余弦反变换之前对多路LC3音频码流的频谱系数进行混合,能够在确保语音可懂度的前提下降低混音服务器的算力需求。
[0006]为了实现上述目的,本申请采用的一个技术方案是:提供一种LC3音频混合方法,其包括:
[0007]将混音服务器接收到的多路LC3音频码流分别根据标准LC3解码步骤进行半解码得到低延迟改进型离散余弦反变换之前的每一路LC3音频码流的频谱系数;将低延迟改进型离散余弦反变换之前每一路LC3码流的频谱系数进行叠加得到混合频谱系数;以及,对混合频谱系数根据标准LC3解码步骤继续进行解码得到混合PCM音频数据。
[0008]本申请采用的另一个技术方案是:提供一种LC3音频混合装置,其包括:
[0009]用于将混音服务器接收到的多路LC3音频码流分别根据标准LC3解码步骤进行半解码得到低延迟改进型离散余弦反变换之前的每一路LC3音频码流的频谱系数的模块;用于将低延迟改进型离散余弦反变换之前每一路LC3码流的频谱系数进行叠加得到混合频谱系数的模块;以及,用于对混合频谱系数根据标准LC3解码步骤继续进行解码得到混合PCM音频数据的模块。
[0010]本申请采用的另一个技术方案是:提供一种计算机可读存储介质,其存储有计算机指令,该计算机指令被操作以执行方案一中的LC3音频混合方法。
[0011]本申请采用的另一个技术方案是:、提供一种计算机设备,其包括处理器和存储器,存储器存储有计算机指令,该计算机指令被操作以执行方案一中的LC3音频混合方法。
[0012]本申请的技术方案可以达到的有益效果是:一种LC3音频混合方法、装置及存储介质。该方法采用时域频域相结合的混音方法,在低延迟改进型离散余弦反变换之前在频域对多路LC3音频码流的频谱系数进行混合,能够在确保语音可懂度的前提下降低混音服务器的算力需求。
附图说明
[0013]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0014]图1是现有技术中的混音方案示意图。
[0015]图2是本申请一种LC3音频混合方法的一个具体实施方式的示意图;
[0016]图3是本申请一种LC3音频混合方法的一个具体实施例的示意图;
[0017]图4是本申请一种LC3音频混合装置的一个具体实施方式的示意图;
[0018]图5是本申请一种LC3音频混合装置的一个具体实施例的示意图。
[0019]通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
[0020]下面结合附图对本申请的较佳实施例进行详细阐述,以使本申请的优点和特征能更易于被本领域技术人员理解,从而对本申请的保护范围做出更为清楚明确的界定。
[0021]需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括
……”
限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0022]LC3编解码器在会议电话应用时,通常需要利用混音服务器需要对多路音频进行混音(实际应用时混音的路数取决于具体的场景,本申请不做限制)。现有技术中会先对接收到的多LC3码流分别进行解码,得到多路音频PCM的时域信号,之后对多路PCM的时域信号进行混音得到混合音频,最后对混合音频进行饱和处理得到输出信号。
[0023]在音频信号处理,特别是语音信号处理中,通常用16bit精度来表示采样点,即每个采样点的范围是:
[0024]无符号数:0~65535;
[0025]有符号数:
‑
32768~32767。
[0026]其中有符号数表示方法使用范围更广,本文的叙述主要以此为例。假定有N路音频,
[0027]Input1,input2,
…
,inputN
[0028]每路音频有M个采样点,
[0029]Input1[1],input1[2],
…
,input1[M][0030]Input2[1],input2[2],
…
,input2[M][0031],
…
,
[0032]InputN[1],inputN[2],
…
,inputN[M][0033]使用线性叠加进行混音,第k个采样点混音的结果是:
[0034]Output[k]=Input1[k]+Input2[k]+,
…
...
【技术保护点】
【技术特征摘要】
1.一种LC3音频混合方法,其特征在于,包括,将混音服务器接收到的多路LC3音频码流分别根据标准LC3解码步骤进行半解码得到低延迟改进型离散余弦反变换之前的每一路所述LC3音频码流的频谱系数;将所述低延迟改进型离散余弦反变换之前的每一路所述LC3码流的所述频谱系数进行叠加得到混合频谱系数;以及,对所述混合频谱系数根据所述标准LC3解码步骤继续进行解码得到混合PCM音频数据。2.根据权利要求1所述的LC3音频混合方法,其特征在于,进一步包括,对所述混合PCM音频数据进行饱和处理得到混合音频,并将所述混合音频进行输出。3.根据权利要求1所述的LC3音频混合方法,其特征在于,所述将混音服务器接收到的多路LC3音频码流分别根据标准LC3解码步骤进行半解码得到低延迟改进型离散余弦反变换之前的每一路所述LC3音频码流的频谱系数的过程包括,将所述多路LC3音频码流分别根据标准LC3解码步骤进行半解码,得到变换域噪声整形解码之后所述低延迟改进型离散余弦反变换之前的每一路所述LC3音频码流的频谱系数。4.根据权利要求1所述的LC3音频混合方法,其特征在于,所述对所述混合频谱系数根据所述标准LC3解码步骤继续进行解码得到混合PCM音频数据的过程包括,对所述混合频谱系数根据所述标准LC3解码步骤继续进行解码,在低延迟改进型离散余弦反变换步骤之后不经所述长期后置滤波解码步骤直接得到所述混合PCM音频数据。5.一种LC3音频混合装置,其特征在于,包括,用于将混音服务器接收到的多路LC3音频码流分别根据标准LC3解码步骤进行半解码得到低延迟改进型离散余弦反...
【专利技术属性】
技术研发人员:李强,王尧,叶东翔,朱勇,
申请(专利权)人:北京百瑞互联技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。