【技术实现步骤摘要】
音频信号区分器和编码器本申请是2015年5月7日提交的、申请号为201580023968.9、专利技术名称为“音频信号区分器和编码器”的专利申请的分案申请。
所提出的技术大体上涉及用于音频编码的编解码器和方法。
技术介绍
现代音频编解码器由针对具有不同属性的信号优化的多个压缩方案组成。实际上没有例外,用时域编解码器处理类语音信号,而用变换域编解码器处理音乐信号。应该处理语音和音乐信号二者的编码方案需要一种识别输入信号包括语音还是音乐的机制,并且在适当的编解码器模式之间切换。这种机制可以被称为语音音乐分类器或区分器。在图1a中示出了使用基于输入信号的模式判决逻辑的多模音频编解码器的概述说明。用类似的方式,在音乐信号类别中,可以从谐波音乐信号中区分出更多的类噪声音乐信号,并且为这些组中的每一个构建分类器和最佳编码方案。图1b中示出了创建分类器以确定信号的类别、该分类器然后控制模式判决的概要。在音频编码领域中存在各种语音音乐分类器。然而,这些分类器不能在音乐信号的空间中的不同类别之间区分。事实上,许多已知的 ...
【技术保护点】
1.一种音频信号分类方法,所述方法包括:/n针对音频信号的分段:/n-识别频谱峰值的集合;/n-确定所述集合中的峰值之间的平均距离S;/n-确定峰值包络能量与噪声基底包络能量之间的比率PNR;/n-比较所述平均距离S与第一阈值;/n-比较所述比率PNR与第二阈值;以及/n-基于所述平均距离S与第一阈值的比较以及所述比率PNR与第二阈值的比较,将音频信号分段分类为多个音频信号类别中的一个类别。/n
【技术特征摘要】
20140508 US 61/990,3541.一种音频信号分类方法,所述方法包括:
针对音频信号的分段:
-识别频谱峰值的集合;
-确定所述集合中的峰值之间的平均距离S;
-确定峰值包络能量与噪声基底包络能量之间的比率PNR;
-比较所述平均距离S与第一阈值;
-比较所述比率PNR与第二阈值;以及
-基于所述平均距离S与第一阈值的比较以及所述比率PNR与第二阈值的比较,将音频信号分段分类为多个音频信号类别中的一个类别。
2.根据权利要求1所述的方法,其中,当确定S时,每个峰值由一个频谱系数表示,所述一个频谱系数是与所述峰值相关联的频谱系数中具有最大平方幅度的频谱系数。
3.根据权利要求1所述的方法,其中,基于频谱系数的绝对值和与低能量系数相比突出高能量系数的贡献的加权因子来估计峰值包络。
4.根据权利要求1所述的方法,其中,基于频谱系数的绝对值和与高能量系数相比突出低能量系数的贡献的加权因子来估计噪声基底包络。
5.一种音频信号分类器,所述音频信号分类器被配置为:
针对所述音频信号的分段:
-识别频谱峰值的集合;
-确定所述集合中的峰值之间的平均距离S;
-确定峰值包络能量与噪声基底包络能量之间的比率PNR...
【专利技术属性】
技术研发人员:艾力克·诺维尔,沃洛佳·格兰恰诺夫,
申请(专利权)人:瑞典爱立信有限公司,
类型:发明
国别省市:瑞典;SE
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。