一种确定非噪声音频信号类别的方法及装置制造方法及图纸

技术编号:3048331 阅读:176 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种确定非噪声音频信号类别的方法,首先,获取非噪声音频信号的特征参数;然后,根据所述特征参数,利用决策树初步判决所述非噪声音频信号的类别;最后,根据所述非噪声音频信号的语境和所述初步判决的结果,确定所述非噪声音频信号的类别。本发明专利技术还公开了一种确定非噪声音频信号类别的装置。本发明专利技术通过不依赖于编码器算法的非噪声音频信号的特征参数,对所述非噪声音频信号的类别进行判定,增强了算法的独立性和可移植性。

【技术实现步骤摘要】

本专利技术涉及无线通信
,特别是涉及一种确定非噪声音频信号类 别的方法及装置。
技术介绍
随着无线通信技术的迅速发展,VAD (Voice Activity Detection,语音活动 检测)技术得到了广泛的应用。每一种VAD方法都使用了多种特征参数,其 中大部分来自或派生于编码器编码过程中产生的特征参数。例如GSM (Global System for Mobile communication,全J求移动通4言系统)制订了四种 语音编码器规范,即GSM全速率、GSM增强全速率、GSM半速率和自适应 多速率语音编码器,它们所依据的编码算法均有所区别,但是均包含了将语 音信号从通信信号中检测出来的VAD模块。其中,GSM全速率、增强全速 率和半速率这三种VAD算法的计算复杂度比较低,使用的参数都包含信号的 能量、频语稳定信息和基音信息等,其中,信号能量是主要判决依据,但它 对噪声的敏感度比较高,后两种特征参数仅对判决阈值起作用,但对算法的 依赖度比较高,即与编码算法有一定的耦合度。ITU (International Telecommunications Union,国际电^本文档来自技高网...

【技术保护点】
一种确定非噪声音频信号类别的方法,其特征在于,包括以下步骤: 获取非噪声音频信号的特征参数; 根据所述特征参数,利用决策树初步判决所述非噪声音频信号的类别; 根据所述非噪声音频信号的语境和所述初步判决的结果,确定所述非噪声音频信号的类别。

【技术特征摘要】
1、一种确定非噪声音频信号类别的方法,其特征在于,包括以下步骤获取非噪声音频信号的特征参数;根据所述特征参数,利用决策树初步判决所述非噪声音频信号的类别;根据所述非噪声音频信号的语境和所述初步判决的结果,确定所述非噪声音频信号的类别。2、 如权利要求l所述确定非噪声音频信号类别的方法,其特征在于,所 述特征参数包括如下参数中的至少一个归一化帧间i普波动flux;归一〗匕帧间i普波动的方差varflux;归一化帧间 谱波动的方差滑动平均varmovflux;归一化频带谱波动fflux;归一化频带谱 波动的方差varfflux;归一化频带谱波动的方差滑动平均varmovfflux;归一化 子带能量标准差stdave;能量比率ratiol;能量比率的长时平均mov—ratiol; 能量比率的方差var—ratiol;时域过零率zcr;谐波结构稳定性特征hss。3、 如权利要求1所述确定非噪声音频信号类别的方法,其特征在于,当所述决策树为多变量决策树时,所述利用决策树初步判决非噪声音频信号的类别,具体包括利用包括多个特征参数的超平面决策树结点,初步判决所 述非噪声音频信号为语音信号或音乐信号。4、 如权利要求l所述确定非噪声音频信号类别的方法,其特征在于,当 所述决策树为单变量决策树时,所述利用决策树初步判决非噪声音频信号的 类别,具体包括利用 一个或多个包括一个特征参数及预先设定的与所述特征参数对应的 参数门限值的决策树结点,获取当前非噪声音频信号的音乐/语音概率;根据所述当前非噪声音频信号的音乐/语音概率和预先设定的概率门限 值,判定所述当前非噪声音频信号为语音信号、音乐信号或不确定信号;根据对所述当前非噪声音频信号的判定结果,和相邻连续语音信号帧或 相邻连续音乐信号帧的帧数,判定所述当前非噪声音频信号为语音信号或音 乐信号。5、 如权利要求4所述确定非噪声音频信号类别的方法,其特征在于,当 利用多棵单变量决策树获取当前非噪声音频信号的音乐/语音概率时,在每棵单变量决策树获取到音乐/语音概率之后,还包括选择所述多棵单变量决策 树获取的音乐/语音概率中最大的音乐/语音概率为当前非噪声音频信号的音 乐/语音概率。6、 如权利要求5所述确定非噪声音频信号类别的方法,其特征在于,所 述多棵单变量决策树包括短时决策树和长时决策树。7、 如权利要求l所述确定非噪声音频信号类别的方法,其特征在于,所 述根据非噪声音频信号的语境和初步判决的结果,确定非噪声音频信号的类别,具体包括根据拖尾保护值和初步判决的结果,判定所述非噪声音频信号为语音信 号或音乐信号。8、 如权利要求l所述确定非噪声音频信号类别的方法,其特征在于,在 确定非噪声音频信号的类别之后,还包括在所述非噪声音频信号进行语音 状态和音乐状态的转换之间加入过渡状态。9、 如权利要求8所述确定非噪声音频信号类别的方法,其特征在于,所 述在非噪声音频信号进行语音状态和音乐状态的转换之间加入过渡状态,具 体包括当确定所述非噪声音频信号的类别为语音信号,且所述非噪声音频信号 之前的类别为音乐信号时,所述非噪声音频信号由音乐状态进入过渡状态;当所述非噪声音频信号的类别持续确定为语音信号的时间到达预先设置 的持续时间门限值时,所述非噪声音频信号由过渡状态进入语音信号状态; 以及当确定所述非噪声音频信...

【专利技术属性】
技术研发人员:王珺王喆
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利