生成下混信号的方法和装置制造方法及图纸

技术编号:13831628 阅读:92 留言:0更新日期:2016-10-14 10:02
本发明专利技术实施例公开了一种生成下混信号的方法和装置。本发明专利技术实施例方法包括:获取预置声道集合中各声道的音频信号;对所述预置声道集合中各声道的音频信号进行下混,生成初始下混信号;根据所述初始下混信号中的各峰值确定目标峰值;获取目标上限,所述目标上限为所述初始下混信号中采样值的存储上限;当所述目标峰值高于所述目标上限时,将所述初始下混信号除以下调系数,其中,所述下调系数是根据目标峰值和目标上限确定的。

【技术实现步骤摘要】

本专利技术涉及音频处理
,尤其涉及一种生成下混信号的方法和装置
技术介绍
声道是声音在录制或者播放时在不同空间位置采集或者回放的相互独立的音频信号。声道数是声音录制时的音源数量或者回放时相应的扬声器数量。用于将多声道音频信号转换为双声道信号的技术通常被称为下混合技术。利用下混合技术,可由具有两个声道和两个扬声器箱的普通立体声装备再现原始多声道音频信号。目前,广泛运用的多声道音频信号为5.1声道系统,该5.1声道系统中,包括左前方环绕声道L、右前方环绕声道R、中置环绕声道C、左后方环绕声道Ls和右后方环绕声道Rs。在国际电信联盟(英文:International Telecommunication Union,缩写:ITU)规定的从5.1声道混合到2.0立体声的过程中,将左前方环绕声道L、中置环绕声道C、左后方环绕声道Ls该三个声道的音频信号下混从立体声左声道Lo输出,将右前方环绕声道R、中置环绕声道C和右后方环绕声道Rs该三个声道的音频信号下混从立体声右声道Ro输出。具体的,一般根据以下公式计算出立体声左声道Lo和立体声右声道Ro的音频信号:Lo=L+0.707*C+0.707*Ls,Ro=R+0.707*C+0.707*Rs。音频信号包括每秒钟内对音频的所有采样值,其中每一个采样值为采样周期内声音模拟信号的积分值,用于表示声音的振幅。在双声道立体声音频信号中,一般一个采样值用16位(2字节)记录。可以看出,在上面两个公式中,当L=C=Ls=32767(也即16位的最大值)时,根据公式计算出的Lo为79099.538,该数值超过了16位能记录的范围。因此,在无法预知这个发生的情况下,ITU的做法是强制整个运算多除以一个系数1+0.707+0.707,也即Lo=(L+0.707*C+0.707*Ls)/(1+0.707+0.707),Ro=(R+0.707*C+0.707*Rs)/(1+0.707+0.707),以避免溢出的发生。然而,这导致下混合后的音频的响度损失。根据分贝换算公式20*
log10(1/(1+0.7071+0.7071))约等于7.65dB可知,下混合后的音频相比原音频丢失了约7.56dB的响度。
技术实现思路
本专利技术实施例提供了一种生成下混信号的方法和装置,能够在保证下混信号的响度损失减小的同时避免下混信号中数据溢出。第一方面,本专利技术提供一种生成下混信号的方法,包括:获取预置声道集合中各声道的音频信号;对所述预置声道集合中各声道的音频信号进行下混,生成初始下混信号;根据所述初始下混信号中的各峰值确定目标峰值;获取目标上限,所述目标上限为所述初始下混信号中采样值的存储上限;当所述目标峰值高于所述目标上限时,将所述初始下混信号除以下调系数,其中,所述下调系数是根据目标峰值和目标上限确定的。第二方面,本专利技术提供一种生成下混信号的装置,包括:第一获取模块,用于获取预置声道集合中各声道的音频信号;下混模块,用于对所述预置声道集合中各声道的音频信号进行下混,生成初始下混信号;确定模块,用于根据所述初始下混信号中的各峰值确定目标峰值;第二获取模块,用于获取目标上限,所述目标上限为所述初始下混信号中采样值的存储上限;下调模块,用于当所述目标峰值高于所述目标上限时,将所述初始下混信号除以下调系数,其中,所述下调系数是根据目标峰值和目标上限确定的。从以上技术方案可以看出,本专利技术实施例具有以下优点:本专利技术中,在根据预置声道集合中的各声道的音频信号下混生成初始下混信号后,并非如现有技术中考虑最坏情况发生(也即预置声道集合中每个声道中的音频均为最大值时得到的初始下混信号中的峰值达到最高值)而强制将初始下混合信号固定除以系数1+0.707+0.707来避免数据溢出的情况,而是先从初始下混信号的各峰值中确定出目标峰值,若该目标峰值高于下混信号的有效存储最大值(即目标上限),则将所述初始下混信号除以下调系数,
该下调系数是根据目标峰值和目标上限确定的;由于一般情况下该目标峰值要小于初始下混信号中峰值所能达到的最高值,因此将初始下混信号除以下调系数后响度的损失要小于现有技术中造成的响度损失,而且能够避免下混信号中数据溢出。附图说明图1为本专利技术的生成下混信号的方法的一个实施例的流程示意图;图2为本专利技术的生成下混信号的装置的一个实施例的结构示意图;图3为本专利技术的终端的一个实施例的结构示意图。具体实施方式请参阅图1,图1为本专利技术的生成下混信号的方法的一个实施例的流程示意图。本实施例中,生成下混信号的方法包括:101、获取预置声道集合中各声道的音频信号。本实施例中,预置声道集合中包括至少两个声道。具体举例来说,该预置声道集合中包括左前方环绕声道、左后方环绕声道、中置环绕声道和左环绕声道中的至少两个声道。又例如,该预置声道集合中包括右前方环绕声道、右后方环绕声道、中置环绕声道和右环绕声道中的至少两个声道。其中,每个声道的音频信号中包括在每秒内对该声道的声音信号的采样数据。举例来说,音频在每秒钟内对声音模拟信号有44100次采样,那么每秒内的采样数据包括44100个采样值,其中每一个采样值指每一次采样周期内声音信号的的积分值,该积分值用于表示声音信号的振幅。102、对所述预置声道集合中各声道的音频信号进行下混,生成初始下混信号。本实施例中,下混指的是将不同声道中的音频进行混合以从一个声道中输出,该输出的信号称为下混信号。举例来说,预置声道集合中包括左前方环绕声道、左后方环绕声道和中置环绕声道,对该预置声道集合中的三个声道的音频信号进行下混,生成立体声的左声道的初始下混信号。或者,预置声道集合中包括右前方环绕声道、右后方环绕声道和中置环绕声道,对该预置声道集合中的三个声道的音频信号进行下混,生成立体声的右声道的初始下混信号。本实施例中,对各声道的音频信号进行下混的方法为现有技术,在此不再赘述。103、根据所述初始下混信号中的各峰值确定目标峰值。本实施例中,根据初始下混信号中的各峰值确定目标峰值的方法有多种。例如,将初始下混信号中的各峰值中取值最大的峰值作为目标峰值。104、获取目标上限,所述目标上限为所述初始下混信号中采样值的存储上限。本实施例中,该目标上限的具体取值取决于用于存储初始下混信号中每一个采样值的位数。例如,每一个采样值用16位(2字节)存储,那么所能存的上限为32767,也即目标上限为32767。当然,每一个采样值也可以用8位、24位、32位、浮点32位、浮点64位等其他位数进行存储,在此不作限制,相应地存储上限也会随之改变。105、当所述目标峰值高于所述目标上限时,将所述初始下混信号除以下调系数,其中,所述下调系数是根据目标峰值和目标上限确定的。确定初始下混信号中的目标峰值后,若该目标峰值高于目标上限,那么可以确定直接存储初始下混信号会导致数据溢出,因此确定下调系数,该下调系数是根据目标峰值和目标上限确定的。具体的,该下调系数为所述目标峰值和所述目标上限的比值,或者,所述目标峰值和所述目标上限的比值为下调系数中的一个因子,在此不作限制。然后将初始下混信号中的所有采样值均除以该下调系数。这样,可避免目标峰值高于目标上限。可选的,在本专利技术一些可能的实施方式中,由于目标峰值并不本文档来自技高网
...

【技术保护点】
一种生成下混信号的方法,其特征在于,包括:获取预置声道集合中各声道的音频信号;对所述预置声道集合中各声道的音频信号进行下混,生成初始下混信号;根据所述初始下混信号中的各峰值确定目标峰值;获取目标上限,所述目标上限为所述初始下混信号中采样值的存储上限;当所述目标峰值高于所述目标上限时,将所述初始下混信号除以下调系数,其中,所述下调系数是根据目标峰值和目标上限确定的。

【技术特征摘要】
1.一种生成下混信号的方法,其特征在于,包括:获取预置声道集合中各声道的音频信号;对所述预置声道集合中各声道的音频信号进行下混,生成初始下混信号;根据所述初始下混信号中的各峰值确定目标峰值;获取目标上限,所述目标上限为所述初始下混信号中采样值的存储上限;当所述目标峰值高于所述目标上限时,将所述初始下混信号除以下调系数,其中,所述下调系数是根据目标峰值和目标上限确定的。2.根据权利要求1所述的生成下混信号的方法,其特征在于,所述根据所述初始下混信号中的各峰值确定目标峰值,包括:获取峰值集合以及所述峰值集合中每个峰值的出现次数,其中,所述峰值集合为所述初始下混信号中出现的所有峰值;根据所述峰值集合中各峰值的出现次数确定所述目标峰值,其中,所述目标峰值的出现次数大于预置阈值。3.根据权利要求2所述的生成下混信号的方法,其特征在于,所述根据所述峰值集合中各峰值的出现次数确定所述目标峰值,包括:按峰值的取值从大到小对所述峰值集合中各峰值进行依次排序;将排序后序号大于所述预置阈值的各峰值中的第一个特定峰值作为所述目标峰值,其中,所述特定峰值的出现次数大于排序在所述特定峰值之前的所有峰值的出现次数总和。4.根据权利要求2所述的生成下混信号的方法,其特征在于,所述根据所述峰值集合中各峰值的出现次数确定所述目标峰值,包括:按峰值的取值从大到小对所述峰值集合中各峰值进行依次排序;将排序后的各峰值中第一个出现次数大于第一门限值的峰值作为所述目标峰值。5.根据权利要求2所述的生成下混信号的方法,其特征在于,所述根据所述峰值集合中各峰值的出现次数确定所述目标峰值,包括:按峰值的取值从大到小对所述峰值集合中各峰值进行依次排序;将排序后的各峰值中的第一个特定峰值作为所述目标峰值,其中,所述特定峰值以及排在所述特定峰值之前的所有特定峰值的出现次数总和第一次
\t大于第二门限值。6.根据权利要求2至5任一项所述的生成下混信号的方法,其特征在于,所述将所述初始下混信号除以下调系数之后,所述方法还包括:将所述初始下混信号中高于所述目标上限的采样值替换为所述目标上限。7.一种生成下混信号的装置,其特征在于,包括:第...

【专利技术属性】
技术研发人员:冯穗豫
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1