音频信号分类和编码制造技术

技术编号:24253143 阅读:40 留言:0更新日期:2020-05-23 00:25
本发明专利技术涉及编解码器和信号分类器以及其中的基于音频信号特征进行的信号分类和编码模式选择的方法。一种由解码器执行的方法实施例包括,针对帧m:基于变换域中帧m的频谱包络的范围和相邻帧m‑1的频谱包络的相应范围之间的差,确定稳定性值D(m)。每个这种范围包括与音频信号的分段的频谱带中的能量相关的量化频谱包络值的集合。所述方法还包括:基于所述稳定性值D(m)从多个解码模式中选择解码模式;以及应用所选的解码模式。

Audio signal classification and coding

【技术实现步骤摘要】
音频信号分类和编码本申请是申请日为2015年5月12日、申请号为201580026065.6的中国专利技术专利申请“音频信号分类和编码”的分案申请。
本专利技术涉及音频编码,并且更具体地涉及为了编码对输入信号特征进行分析和匹配。
技术介绍
蜂窝通信网络朝着更高的数据速率、改进的容量和改进的覆盖演进。在第三代合作伙伴项目(3GPP)标准主体中,已经开发了并且当前也正在开发若干技术。LTE(长期演进)是标准化技术的示例。在LTE中,针对下行链路使用基于OFDM(正交频分复用)的接入技术,而针对上行链路使用基于单载波FDMA(SC-FDMA)的接入技术。通常在考虑每个无线终端的瞬时业务模式和无线电传播特征的情况下通过使用快速调度自适应地执行在下行链路和上行链路二者上对无线终端(也被称为用户设备,UE)的资源分配。LTE上的一种数据类型是例如用于语音会话或流音频的音频数据。为了改进低比特率语音和音频编码的性能,利用关于信号特征的先验知识并采用信号建模,这是公知的。在使用更复杂信号的情况下,可以针对信号的不同部分使用若干编码模型或编码模式。这些编码模式还可能涉及用于处理信道错误和丢失分组的不同策略。在任何时候选择适当的编码模式是有益的。
技术实现思路
本文所述的解决方案涉及可用于编码方法选择和/或错误隐藏方法选择二者(其在本文中已被概括为编码模式的选择)的信号分类或区分的低复杂度的、稳定的适配。在错误隐藏的情况下,该解决方案涉及解码器。根据第一方案,提供了一种对音频信号进行解码的方法。所述方法包括,针对帧m:基于变换域中帧m的频谱包络的范围和相邻帧m-1的频谱包络的相应范围之间的差,确定稳定性值D(m)。每个这种范围包括与音频信号的分段的频谱带中的能量相关的量化频谱包络值的集合。所述方法还包括:基于所述稳定性值D(m)从多个编码模式中选择编码模式;以及应用所选的解码模式。根据第二方案,提供了一种用于对音频信号进行解码的解码器。所述解码器被配置为,针对帧m:基于变换域中帧m的频谱包络的范围和相邻帧m-1的频谱包络的相应范围之间的差,确定稳定性值D(m)。每个这种范围包括与音频信号的分段的频谱带中的能量相关的量化频谱包络值的集合。所述编码器还被配置为:基于所述稳定性值D(m)从多个解码模式中选择编码模式;以及应用所选的解码模式。根据第三方案,提供了一种对音频信号进行编码的方法。所述方法包括,针对帧m:基于变换域中帧m的频谱包络的范围和相邻帧m-1的频谱包络的相应范围之间的差,确定稳定性值D(m)。每个这种范围包括与音频信号的分段的频谱带中的能量相关的量化频谱包络值的集合。所述方法还包括:基于所述稳定性值D(m)从多个解码模式中选择解码模式;以及应用所选的编码模式。根据第四方案,提供了一种用于对音频信号进行编码的编码器。所述编码器被配置为,针对帧m:基于变换域中帧m的频谱包络的范围和相邻帧m-1的频谱包络的相应范围之间的差,确定稳定性值D(m)。每个这种范围包括与音频信号的分段的频谱带中的能量相关的量化频谱包络值的集合。所述编码器还被配置为:基于所述稳定性值D(m)从多个解码模式中选择解码模式;以及应用所选的编码模式。根据第五方案,提供了一种音频信号分类方法。所述方法包括,针对语音信号的帧m:基于变换域中帧m的频谱包络的范围和相邻帧m-1的频谱包络的相应范围之间的差,确定稳定性值D(m),每个范围包括与所述音频信号的分段的频谱带中的能量相关的量化频谱包络值的集合。所述方法还包括:基于稳定性值D(m)对所述语音信号分类。根据第六方案,提供了一种音频信号分类器。音频信号被配置为,针对语音信号的帧m:基于变换域中帧m的频谱包络的范围和相邻帧m-1的频谱包络的相应范围之间的差,确定稳定性值D(m),每个范围包括与所述音频信号的分段的频谱带中的能量相关的量化频谱包络值的集合;以及还基于稳定性值D(m)对所述语音信号分类。根据第七方案,提供了一种主机设备,包括根据第二方案的解码器。根据第八方案,提供了一种主机设备,包括根据第四方案的编码器。根据第九方案,提供了一种主机设备,包括根据第六方案的信号分类器。根据第十方案,提供了一种计算机程序,其包括指令,所述指令当在至少一个处理器上执行时使所述至少一个处理器执行根据第一、第三和/或第六方案所述的方法。根据第十一方案,提供了一种包含第九方案所述的计算机程序的载体,其中,所述载体是电信号、光信号、无线电信号或计算机可读存储介质中的一种。附图说明现在将参照附图通过示例描述本专利技术,在附图中:图1是示出了可以应用本文介绍介绍的实施例的蜂窝网的示意图。图2a和图2b是示出了根据示例性实施例的由解码器执行的方法的流程图。图3a是示出从滤波后的稳定性值到稳定性参数的映射曲线的示意图;图3b是示出从滤波后的稳定性值到稳定性参数的映射曲线的示意图,其中映射曲线是从离散值获得的;图4是示出接收的音频帧的信号的频谱包络的示意图;图5a-b是示出在主机设备中执行的用于选择分组丢失隐藏过程的方法的流程图;图6a-c是根据示例实施例示出解码器的不同实施方式的示意框图。图7a-c是根据示例实施例示出编码器的不同实施方式的示意框图。图8a-c是根据示例实施例示出分类器的不同实施方式的示意框图。图9是示出了无线终端的一些组件的示意图;图10是示出了转码节点的一些组件的示意图;以及图11示出了包括计算机可读装置的计算机程序产品的一个示例。具体实施方式现将在下文参考示出本专利技术的特定实施例的附图来更全面地描述本专利技术。然而,本专利技术可以用多种不同形式来实施,并且不应当被解释为受到本文阐述的实施例的限制;相反,这些实施例是作为示例给出的,使得本公开将是透彻和完整的,并将向本领域技术人员充分地传达本专利技术的范围。在本说明书全文中,相似的标记指相似的元素。图1是示出了可以应用本文介绍介绍的实施例的蜂窝网8的示意图。蜂窝网8包括核心网3和一个或多个无线电基站1,这里所述无线电基站1具有演进节点B(也称为eNodeB或eNB)的形式的。无线电基站1也可以是节点B、BTS(基本收发机站)和/或BSS(基站子系统)等的形式。无线电基站1提供与多个无线终端2的无线电连接。术语无线终端也称为移动通信终端、用户设备(UE)、移动终端、用户终端、用户代理、无线设备、机器对机器设备等,并且可以是例如今天通常被称为移动电话或具有无线连接或固定安装端的平板/膝上型计算机。只要下文所描述的原理是适用的,蜂窝网8可以例如符合LTE(长期演进)、W-CDMA(宽带码分多址)、EDGE(增强型数据速率GSM(全球移动通信系统)演进)、GPRS(通用分组无线电服务)、CDMA2000(码分多址2000)或任何其它当前或未来的无线网络(诸如高级LTE)中的任意一个或其组合。在无线电接口上执行无线终端2与无线电基站1之间的来自无线终本文档来自技高网...

【技术保护点】
1.一种用于音频信号分类的方法,所述方法包括:/n基于变换域中帧m的频谱包络的范围和相邻帧m-1的频谱包络的相应范围之间的差,确定稳定性值D(m),每个范围包括与音频信号的分段的频谱带中的能量相关的频谱包络值的集合。/n对所述稳定性值D(m)进行低通滤波,从而获得滤波后的稳定性值

【技术特征摘要】
20140515 US 61/993,6391.一种用于音频信号分类的方法,所述方法包括:
基于变换域中帧m的频谱包络的范围和相邻帧m-1的频谱包络的相应范围之间的差,确定稳定性值D(m),每个范围包括与音频信号的分段的频谱带中的能量相关的频谱包络值的集合。
对所述稳定性值D(m)进行低通滤波,从而获得滤波后的稳定性值
通过使用S型函数将滤波后的稳定性值映射至标量范围[0,1],从而获得稳定性参数S(m);以及
基于所述稳定性参数S(m)对所述音频信号进行分类。


2.根据权利要求1所述的方法,其中,对所述音频信号的分类包括:确定在帧m中表示的音频信号的分段是包括语音还是音乐。


3.根据权利要求1所述的方法,其中,对所述音频信号的分类还基于定义与所述音频信号中的语音和音乐之间的转变相关的状态转移概率的马尔可夫模型。


4.根据权利要求1所述的方法,其中,对所述音频信号的分类还基于指示帧m的频谱内容的瞬态结构的瞬态测量。


5.根据权利要求1所述的方法,其中,将所述稳定性值D(m)确定为



其中,bi表示帧m中的频谱带,并且E(m,b)表示帧m中的频带b的能量测量。


6.一种音频信号分类器,所述分类器被配置为:
基于变换域中帧m的频谱包络的范围和相邻帧m-1的频谱包络的相应范围之间的差,确定稳定性值D(m),每个范围包括与音频信号的分段的频谱带中的能量相关的频谱包络值的集合;
对所述稳定性值D(m)进行低通滤波,从而获得滤波...

【专利技术属性】
技术研发人员:艾力克·诺维尔斯蒂芬·布鲁恩
申请(专利权)人:瑞典爱立信有限公司
类型:发明
国别省市:瑞典;SE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1