音频信号的分类识别方法及装置制造方法及图纸

技术编号：7332582 阅读：358 留言：0更新日期：2012-05-11 03:52

本申请实施例公开了一种音频信号的分类识别方法及装置，所述方法包括：获取一帧音频信号，对所述一帧音频信号进行预处理；通过预处理的结果对所述一帧音频信号之前的音频片段进行更新，生成包含所述一帧音频信号的当前音频片段；从所述当前音频片段中提取分类特征低短时能量比LSTER和跳跃能量比JSTER；根据所述分类特征识别所述一帧音频信号的类型，得到初始分类结果。本申请实施例中每次对一帧音频信号进行识别，由于音频信号的长度远远小于音频片段，因此延时性能极大提高，提高了音频处理的实时性能；通过LSTER和JSTER两个分类特征对音频信号进行识别，增加了音频信号识别的准确性，降低了音频信号识别的复杂度。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及通信
，特别涉及语音音频处理中音频信号的分类识别方法及直O
技术介绍
USAC(Unified Coding of Speech and Audio，语音音频统一编码)是对语音信号和音乐信号的统一编码，在编码过程中需要正确识别出输入信号具有语音特征还是音乐特征，从而选择不同的编码方案对语音信号和音乐信号分别进行编码。参见图1，为现有识别语音和音乐信号的系统示意图。该系统包括MLER (改进型低能量帧率)特征获取模块110、贝叶斯后验分类模块120和后验决策模块130，该系统中基于分类特征进行判断，该分类特征具体为MLER。应用图1所示的系统，首先通过MLER特征获取模块110提取出第i个音频片段的MLER，然后利用贝叶斯后验分类模块120根据预先设置的阈值对该第i个音频片段的类型进行分类识别，最后利用后验决策模块130对前述分类识别的结果进行进一步验证，即后验决策模块130首先对识别结果进行缓存，并设定为初始状态，然后根据后续接收到的分类识别结果对前述保存的初始状态进行决策，利用后续音频片段的分类识别结果对已识别出的分类结果进行验证，以期减少分类误差。现有技术中使用了唯一的分类特征MLTR对音频片段的类型进行识别，每次判定以一个音频片段作为输出，一个音频片段的长度通常为1秒左右，因此相应会引入1秒左右的编码延迟，由此降低了音频处理的实时性能；由于现有技术中基于后验决策方法判断当前音频片段的类型，并且还需要通过后续音频片段的类型对当前音频片段的类型进行后验校验，因此将进一步加大语音音频的处理延时。
技术实现思路
本专利技术实施例提供音频信号的分...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员：金剑，刘贵忠，顿玉洁，杜正中，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人