音频信号分类和编码制造技术

技术编号：24253143 阅读：61 留言：0更新日期：2020-05-23 00:25

本发明专利技术涉及编解码器和信号分类器以及其中的基于音频信号特征进行的信号分类和编码模式选择的方法。一种由解码器执行的方法实施例包括，针对帧m：基于变换域中帧m的频谱包络的范围和相邻帧m‑1的频谱包络的相应范围之间的差，确定稳定性值D(m)。每个这种范围包括与音频信号的分段的频谱带中的能量相关的量化频谱包络值的集合。所述方法还包括：基于所述稳定性值D(m)从多个解码模式中选择解码模式；以及应用所选的解码模式。

Audio signal classification and coding

全部详细技术资料下载

【技术实现步骤摘要】
音频信号分类和编码本申请是申请日为2015年5月12日、申请号为201580026065.6的中国专利技术专利申请“音频信号分类和编码”的分案申请。
本专利技术涉及音频编码，并且更具体地涉及为了编码对输入信号特征进行分析和匹配。
技术介绍
蜂窝通信网络朝着更高的数据速率、改进的容量和改进的覆盖演进。在第三代合作伙伴项目(3GPP)标准主体中，已经开发了并且当前也正在开发若干技术。LTE(长期演进)是标准化技术的示例。在LTE中，针对下行链路使用基于OFDM(正交频分复用)的接入技术，而针对上行链路使用基于单载波FDMA(SC-FDMA)的接入技术。通常在考虑每个无线终端的瞬时业务模式和无线电传播特征的情况下通过使用快速调度自适应地执行在下行链路和上行链路二者上对无线终端(也被称为用户设备，UE)的资源分配。LTE上的一种数据类型是例如用于语音会话或流音频的音频数据。为了改进低比特率语音和音频编码的性能，利用关于信号特征的先验知识并采用信号建模，这是公知的。在使用更复杂信号的情况下，可以针对信号的不同部...

【技术保护点】
1.一种用于音频信号分类的方法，所述方法包括：/n基于变换域中帧m的频谱包络的范围和相邻帧m-1的频谱包络的相应范围之间的差，确定稳定性值D(m)，每个范围包括与音频信号的分段的频谱带中的能量相关的频谱包络值的集合。/n对所述稳定性值D(m)进行低通滤波，从而获得滤波后的稳定性值

【技术特征摘要】
20140515 US 61/993,6391.一种用于音频信号分类的方法，所述方法包括：
基于变换域中帧m的频谱包络的范围和相邻帧m-1的频谱包络的相应范围之间的差，确定稳定性值D(m)，每个范围包括与音频信号的分段的频谱带中的能量相关的频谱包络值的集合。
对所述稳定性值D(m)进行低通滤波，从而获得滤波后的稳定性值
通过使用S型函数将滤波后的稳定性值映射至标量范围[0,1]，从而获得稳定性参数S(m)；以及
基于所述稳定性参数S(m)对所述音频信号进行分类。

2.根据权利要求1所述的方法，其中，对所述音频信号的分类包括：确定在帧m中表示的音频信号的分段是包括语音还是音乐。

3.根据权利要求1所述的方法，其中，对所述音频信号的分类还基于定义与所述音频信号中的语音和音乐之间的转变相关的状态转移概率的马尔可夫模型。

4.根据权利要求1所述的方法，其中，对所述音频信号的分类还基于指示帧m的频谱内容的瞬态结构的瞬态测量。

5.根据权利要求1所述的方法，其中，将所述稳定性值D(m)确定为

其中，bi表示帧m中的频谱带，并且E(m,b)表示帧m中的频带b的能量测量。

6.一种音频信号分类器，所述分类器被配置为：
基于变换域中帧m的频谱包络的范围和相邻帧m-1的频谱包络的相应范围之间的差，确定稳定性值D(m)，每个范围包括与音频信号的分段的频谱带中的能量相关的频谱包络值的集合；
对所述稳定性值D(m)进行低通滤波，从而获得滤波...

【专利技术属性】
技术研发人员：艾力克·诺维尔，斯蒂芬·布鲁恩，
申请(专利权)人：瑞典爱立信有限公司，
类型：发明
国别省市：瑞典;SE

全部详细技术资料下载我是这个专利的主人