多声道音频的处理方法和装置制造方法及图纸

技术编号:14520750 阅读:80 留言:0更新日期:2017-02-01 23:48
本发明专利技术公开了一种多声道音频的处理方法和装置。其中,该方法包括:确定待输出的多声道音频的输出通道;在所述输出通道的数量小于所述多声道音频的声道数量的情况下,获取所述多声道音频的多个声道数据和多个声道数据对应于输出通道的方位数据;对所述方位数据进行修正,得到修正数据,以补充所述方位数据中丢失的数据;基于所述修正数据和所述多个声道数据确定所述输出通道的输出数据。本发明专利技术解决了对多声道音频文件进行降通道处理存在信息丢失的技术问题。

【技术实现步骤摘要】

本专利技术涉及音频处理领域,具体而言,涉及一种多声道音频的处理方法和装置。
技术介绍
现有技术中的音频文件有很多是多声道音频文件,多声道音频文件一般是通过多声道音频播放系统来播放,通常情况下,多声道音频指的是多于两个声道的音频。例如,5.1多声道音频指的是具备五个基本声道(包括左声道、中置声道、右声道、左环绕声道和右环绕声道)和一个超低音LFE声道的环绕声音系统。但是现有技术中有些播放器没有多声道设备,这些没有没多声道设备的播放器在播放多声道音频时,通常采用下述两种方式进行降通道:采用ITU标准的DownMix;采用HRTF虚拟音箱技术。以下以5.1声道为例进行说明:在采用ITU标准DownMix技术时,采用如下计算公式:Lt=1.0*L+0.707*C+0.707*LS,Rt=1.0*R+0.707*C+0.707*RS。其中,Lt为左声道输出,Rt为右声道输出,L为左前声道输入,R为右前声道输入,C为中置声道输入,LS为左环绕声道输入,RS为右环绕声道输入。从公式中可以看出,ITU标准的DownMix技术方案只是对声道的输入数据进行简单的加权处理,并且在处理的过程中完全忽略了LFE声道的影响。特别是当用户使用耳机进行声音回放的时候,左声道完全没有右声道的环绕数据,右声道同样没有左声道的环绕数据,而且输入的各个声道数据的位置信息没有得到保留。而采用HRTF虚拟音箱技术,考虑到了多个声道对声道输出的头相关函数影响,在该虚拟音箱技术中,将固定的权值转换成了带有空间和时间特性的HRTF系数,但是由于HRTF函数的系数的测量是在严格的消音室中完成,采用该系数,会导致频谱缺失。针对上述对多声道音频文件进行降通道处理存在信息丢失的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种多声道音频的处理方法和装置,以至少解决对多声道音频文件进行降通道处理存在信息丢失的技术问题。根据本专利技术实施例的一个方面,提供了一种多声道音频的处理方法,该方法包括:确定待输出的多声道音频的输出通道;在所述输出通道的数量小于所述多声道音频的声道数量的情况下,获取所述多声道音频的多个声道数据和多个声道数据对应于输出通道的方位数据;对所述方位数据进行修正,得到修正数据,以补充所述方位数据中丢失的数据;基于所述修正数据和所述多个声道数据确定所述输出通道的输出数据。根据本专利技术实施例的另一方面,还提供了一种多声道音频的处理装置,该装置包括:第一确定单元,用于确定待输出的多声道音频的输出通道;获取单元,用于在所述输出通道的数量小于所述多声道音频的声道数量的情况下,获取所述多声道音频的多个声道数据和多个声道数据对应于输出通道的方位数据;修正单元,用于对所述方位数据进行修正,得到修正数据,以补充所述方位数据中丢失的数据;第二确定单元,用于基于所述修正数据和所述多个声道数据确定所述输出通道的输出数据。在本专利技术实施例中,在多声道音频的输出通道的数量小于多声道音频的声道数量的情况下,也即,在需对多声道音频进行降通道处理的情况下,获取多声道音频的多个声道数据与输出通道对应的方位数据,补充方位数据中丢失的数据,基于修正后的数据和多个声道数据确定输出。在该方案中在对多声道音频文件进行降通道处理时使用多个声道信息的完整方位信息,从而可以准确确定两个通道的输出数据,解决了现有技术中对多声道音频文件进行降通道处理存在信息丢失的技术问题。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的多声道音频的处理方法的硬件环境的示意图;图2是根据本专利技术实施例的一种可选的多声道音频的处理方法的流程图;图3是根据本专利技术实施例的另一种可选的多声道音频的处理方法的流程图;图4是根据本专利技术实施例的一种可选的多声道音频的虚拟音箱摆放位置的示意图;图5是根据本专利技术实施例的一种可选的多声道音频的处理装置的示意图;图6是根据本专利技术实施例的另一种可选的多声道音频的处理装置的示意图;以及图7是根据本专利技术实施例的一种终端的结构框图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。首先,在对本专利技术实施例进行描述的过程中出现的部分名词或者术语适用于如下解释:HRTF(HeadRelatedTransferFunction):头相关变换函数,是一种音效定位算法。ITU标准是国际电信联盟标准(InternationalTelecommunicationUnion,简称ITU),遵循ITU标准的各种多媒体应用产品可以保证其互操作的兼容性。Downmix:减少混合或者混合后信号减小。实施例1根据本专利技术实施例,提供了一种多声道音频的处理方法的方法实施例。可选地,在本实施例中,上述多声道音频的处理方法可以应用于如图1所示的由服务器102和终端104所构成的硬件环境中。如图1所示,服务器102通过网络与终端104进行连接,上述网络包括但不限于:广域网、城域网或局域网,终端104并不限定于PC、手机、平板电脑等。本专利技术实施例的多声道音频的处理方法可以由服务器102来执行,也可以由终端104来执行,还可以是由服务器102和终端104共同执行。其中,终端104执行本专利技术实施例的多声道音频的处理方法也可以是由安装在其上的客户端来执行。图2是根据本专利技术实施例的一种可选的多声道音频的处理方法的流程图,如图2所示,该方法可以包括以下步骤:步骤S202,确定待输出的多声道音频的输出通道;步骤S204,在输出通道的数量小于多声道音频的声道数量的情况下,获取多声道音频的多个声道数据和多个声道数据对应于输出通道的方位数据;步骤S206,对方位数据进行修正,得到修正数据,以补充方位数据中丢失的数据;步骤S208,基于修正数据和多个声道数据确定输出通道的输出数据。通过上述步骤S202至步骤S208,在多声道音频的输出通道的数量小于多声道音频的声道数量的情况下,也即,在需对多声道音频进行降通道处理的情况下,获取多声道音频的多个声道数据与输出通道对应的方位数据,补充方位数据中丢失的数据,基于修正后的数据和多个声道数据确定输出。在该方案中在对多声道音频文件进行降通道处理时使用多个声道信息的完整方位信息,从而可以准确确定两个通道的输出数据本文档来自技高网
...

【技术保护点】
一种多声道音频的处理方法,其特征在于,包括:确定待输出的多声道音频的输出通道;在所述输出通道的数量小于所述多声道音频的声道数量的情况下,获取所述多声道音频的多个声道数据和所述多个声道数据对应于输出通道的方位数据;对所述方位数据进行修正,得到修正数据,以补充所述方位数据中丢失的数据;基于所述修正数据和所述多个声道数据确定所述输出通道的输出数据。

【技术特征摘要】
1.一种多声道音频的处理方法,其特征在于,包括:确定待输出的多声道音频的输出通道;在所述输出通道的数量小于所述多声道音频的声道数量的情况下,获取所述多声道音频的多个声道数据和所述多个声道数据对应于输出通道的方位数据;对所述方位数据进行修正,得到修正数据,以补充所述方位数据中丢失的数据;基于所述修正数据和所述多个声道数据确定所述输出通道的输出数据。2.根据权利要求1所述的方法,其特征在于,所述多个声道数据至少包括低音声道数据和至少两个基本声道数据,获取所述多个声道数据对应于输出通道的方位数据包括:将所述低音声道数据叠加至所述至少两个基本声道数据,得到叠加后的基本声道数据;获取所述叠加后的基本声道数据对应所述输出通道的方位数据。3.根据权利要求2所述的方法,其特征在于,将所述低音声道数据叠加至所述至少两个基本声道数据包括:将所述低音声道数据叠加至所述至少两个基本声道数据中的左前声道数据和右前声道数据。4.根据权利要求3所述的方法,其特征在于,将所述低音声道数据叠加至所述至少两个基本声道数据中的左前声道数据和右前声道数据包括:按照如下公式将所述低音声道数据叠加至所述至少两个基本声道数据中的左前声道数据和右前声道数据:L'=L+LFE*gain1,其中,L'表示叠加后的左前声道数据,L表示所述至少两个基本声道数据中的左前声道数据,LFE表示所述低音声道数据,gain1表示所述低音声道数据对应所述左前声道数据的混音增益;R'=R+LFE*gain2,其中,R'表示叠加后的右前声道数据,R表示所述至少两个基本声道数据中的右前声道数据,gain2表示所述低音声道数据对应所述右前声道数据的混音增益。5.根据权利要求1所述的方法,其特征在于,对所述方位数据进行修正,得到修正数据包括:对所述多个声道数据的方位数据进行频谱修正,得到频谱修正数据;对所述频谱修正数据进行混响处理,得到所述修正数据。6.根据权利要求1所述的方法,其特征在于,基于所述修正数据和所述多个声道数据确定所述输出通道的输出数据包括:对所述修正数据和所述多个声道数据进行卷积叠加,得到所述输出通道的输出数据。7.根据权利要求6所述的方法,其特征在于,所述输出通道包括第一通道和第二通道,其中,对所述修正数据和所述多个声道数据进行卷积叠加,得到所述输出通道的输出数据包括:利用如下公式确定所述第一通道的输出数据:其中,Lt表示所述第一通道的输出数据,AxL表示第x个声道数据的第一修正数据,X表示第x个声道数据;利用如下公式确定所述第二通道的输出数据:其中,Rt表示所述第一通道的输出数据,AxR表示第x个声道数据的第...

【专利技术属性】
技术研发人员:杨将
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1