一种音频类别的实时识别方法及装置制造方法及图纸

技术编号：4211608 阅读：211 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种音频类别的实时识别方法及装置，所述实时识别方法包括以下步骤：ａ．计算分析区间内的音频信号的短时能量均方根，所述短时能量均方根小于预设的静音检测阈值时，进入步骤ｂ；ｂ．分别对所述音频信号的各帧信号进行实倒谱分析；ｃ．根据所述实倒谱分析结果计算所述音频信号的短时特征，并根据所述短时特征，采用阈值法识别所述音频信号的类别。本发明专利技术所述技术方案实时有效地实现了基于实倒谱的音频类别的识别。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及通信领域，尤其涉及一种音频类别的实时识别方法及装置。
技术介绍
在音频的编解码过程中，音乐和语音信号往往采用不同的编解码方式，因此，音频编解码之前需要识别其类别，确定是音乐还是语音。对音频类别的识别难度在于音乐以及语音中噪声的多变。目前，对音乐和语音的识别主要通过短时分析及长时分析实现。短时分析中，从音频信号短时处理出发提取的短时特征仅仅利用了少量的有用信息，不足以反映音乐和语音两类信号的差异；长时分析中，由于缺乏有力的特征描述，或者通过对较长的时间片如整个音频文件的分析实识别；前者虽然能较好地反映音乐和语音两类信号的差异，但对采样率和计算量的要求较高，延时长，不适用于实时通信领域，而后者的识别特征不够稳健，难以在复杂的通信环境中保证其识别有效性。
技术实现思路
本专利技术要解决的技术问题是提供一种音频类别的实时识别方法及装置，实时有效地实现了基于实倒谱的音频类别的识别。5本专利技术解决其技术问题所采用的技术方案是一种音频类别的实时识别方法，包括以下步骤a、计算分析区间内的音频信号的短时能量均方4艮，所述短时能量均方根小于预设的静...

【技术保护点】
一种音频类别的实时识别方法，其特征在于，包括以下步骤：　ａ、计算分析区间内的音频信号的短时能量均方根，所述短时能量均方根小于预设的静音检测阈值时，进入步骤ｂ；　ｂ、分别对所述音频信号的各帧信号进行实倒谱分析；　ｃ、根据所述实倒谱分析结果计算所述音频信号的短时特征，并根据所述短时特征，采用阈值法识别所述音频信号的类别。

【技术特征摘要】

【专利技术属性】
技术研发人员：付中华，刘开文，
申请(专利权)人：中兴通讯股份有限公司，
类型：发明
国别省市：94[]

全部详细技术资料下载我是这个专利的主人