一种用于语音质量客观评价的准干净语音构造方法技术

技术编号:12053261 阅读:148 留言:0更新日期:2015-09-16 17:24
本发明专利技术公开了一种用于语音质量客观评价的准干净语音构造方法,该方法采用一种改进的最小值控制递归平均算法与多带谱减法获得失真语音的准干净语音,主要包括:(1)区分失真语音非语音段与语音段;(2)根据非语音段与语音段的划分分别估计非语音段与语音段的噪声功率谱;(3)根据非语音段与语音段噪声谱估计值,计算失真语音的准干净语音功率谱。具有将准干净语音与失真语音作为PESQ算法的输入语音、获得失真语音的客观评价分值等优点。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了,该方法采用一种改进的最小值控制递归平均算法与多带谱减法获得失真语音的准干净语音,主要包括:(1)区分失真语音非语音段与语音段;(2)根据非语音段与语音段的划分分别估计非语音段与语音段的噪声功率谱;(3)根据非语音段与语音段噪声谱估计值,计算失真语音的准干净语音功率谱。具有将准干净语音与失真语音作为PESQ算法的输入语音、获得失真语音的客观评价分值等优点。【专利说明】
本专利技术涉及一种语音质量客观评价技术,特别涉及一种用于语音质量客观评价的 准干净语音构造方法,该语音构造方法属于无参考源(Non-intrusive)的语音质量客观评 价领域。
技术介绍
语音质量好坏是评价语音通信系统优劣的重要标准之一。语音质量评价一般分为 主观评价方法和客观评价方法。主观评价方法依靠评听者意见对语音质量做出判决,是直 接反映用户对系统好坏的观点,其中ITU-T建议P. 830提出的M0S(Mean Opinion Score) 是一种广泛使用的主观评价方法。但是,主观评价方法重复性差,难以组织实施不够灵活, 容易受人的主观因素影响,不利于在生产过程和现场实验中应用。 客观评价方法杜绝了人为因素可能产生的影响,针对语音信号的特定特征,采用 信号处理的方式实现语音质量的评价过程。客观评价方法根据是否需要参考源信号(干净 语音)分为有参考源(Intrusive)客观评价方法和无参考源(Non-Intrusive)客观评价方 法。有参考源客观评价方法以语音系统的输入信号和输出信号之间的误差大小判别语音 质量的好坏,是一种误差度量,其中ITU-T建议P. 862提出的PESQ感知语音质量评价是目 前性能较好的有参考源客观评价方法,能够较好的识别通信时延,环境噪声和错误。然而, PESQ以及其他有参考源客观评价方法需要使用输入语音(干净语音)作为参考,不能在只 有失真信号的应用领域中使用。 ITU-T建议P. 563是目前无参考源客观评价方法的标准,能够应用于无参考信号 的VoIP和电信网络性能的监测,但其运算复杂度高,不利于实时评价语音质量,且评价性 能不及PESQ。目前主流的基于统计模型的客观评价方法主要基于高斯混合模型(GMM)和矢 量量化(Vector Quantization),该类方法在模型训练过程中将干净语音训练为参考模型 和参考码本,测试时将失真语音与参考模型与参考码本进行失真计算,误差结果映射为最 终的客观质量评分。基于统计模型在模型训练过程中不仅需要大量的干净语音数据,而且 其评价性能与PESQ相差较大。 准干净语音构造技术通过噪声跟踪算法估计失真语音的噪声谱,消除失真语 音的噪声部分,获得失真语音的准干净语音。不同于语音活动检测(Voice Activity Detection)只在非语音段更新噪声功率谱,噪声跟踪算法能够在话音活动期间持续进行较 好的噪声估计,更加适合噪声非平稳场景。最小值控制递归平均算法相对于其他噪声跟踪 算法(Martin, 2001 ;Doblinger, 1995 ;Hirsch and Ehrlicher, 1995 ;Cohen, 2003)能够更 快地在非平稳噪声环境下估计噪声功率谱。但是,最小值控制递归平均算法在估计与更新 噪声谱时统一对失真语音进行估计,并没有对失真语音进行语音段和非语音段的区分,因 此估计结果与实际的噪声功率谱相比存在一定的误差,并且对失真语音噪声谱的统一估计 增加了计算复杂度,降低了算法的效率,不利于实时估计。
技术实现思路
本专利技术的目的在于克服现有技术中无参考源客观评价方法的缺陷的缺点与不足, 提供,该语音构造方法,可以将噪声跟 踪与消除方法引入失真语音的准干净语音构造。 本专利技术的目的通过下述技术方案实现:一种用于语音质量客观评价的准干净语音 构造方法,包括以下步骤: 步骤1、改进的最小值控制递归平均算法在失真语音的噪声谱估计中区分非语音 段与语音段,根据非语音段的特性更新非语音段的噪声谱估计值; 步骤2、对语音帧进行噪声估计时,改进的最小值控制递归平均算法在确定语音帧 频带语音存在概率时,采用新的频率相关阈值; 步骤3、改进的最小值控制递归平均算法根据非语音段和语音段的噪声功率谱估 计确定最终带噪语音的噪声功率谱估计值; 步骤4、改进的最小值控制递归平均算法采用语音活动检测方式划分非语音段与 语音段,利用过零率和短时能量时域特征,sohn算法分别确定失真语音的语音段以及语音 段中的话间非语音段; 步骤5、多带谱减法根据非语音段与语音段的划分和对应的噪声谱估计值,分别 计算准干净语音的非语音段与语音段准干净功率谱,从而获得失真语音的准干净语音功率 谱。 在步骤1中,所述改进的最小值控制递归平均算法基于非语音段与语音段的划 分;把非语音段认定为噪声,噪声谱估计值D(λ uv,k) = | γ(λ uv,k) |2,其中,| γ(λ uv,k) |2为 非语音帧短时功率谱,λ uv为非语音段的帧数索引,k为频带索引。 所述非语音段与语音段的划分通过语音活动检测的方式实现,即:利用过零率和 短时能量等时域特征对失真语音进行粗估计,找出失真语音的语音段的开始时刻与结束时 亥|J,排除背景噪声,确定失真语音的整体语音段,采用sohn语音活动检测算法对上述定位 的整体语音段进行细估计,确定语音段中的语音部分和话间非语音部分。 在步骤2中,所述改进的最小值控制递归平均算法对语音帧进行噪声估计时,采 用的频率相关阈值δ (k)的定义为: 【权利要求】1. ,其特征在于,包括以下步骤: 步骤1、改进的最小值控制递归平均算法在失真语音的噪声谱估计中区分非语音段与 语音段,根据非语音段的特性更新非语音段的噪声谱估计值; 步骤2、对语音帧进行噪声估计时,改进的最小值控制递归平均算法在确定语音帧频带 语音存在概率时,采用新的频率相关阈值; 步骤3、改进的最小值控制递归平均算法根据非语音段和语音段的噪声功率谱估计确 定最终带噪语音的噪声功率谱估计值; 步骤4、改进的最小值控制递归平均算法采用语音活动检测方式划分非语音段与语音 段,利用过零率和短时能量时域特征,sohn算法分别确定失真语音的语音段以及语音段中 的话间非语音段; 步骤5、多带谱减法根据非语音段与语音段的划分和对应的噪声谱估计值,分别计算准 干净语音的非语音段与语音段的准干净功率谱,从而获得失真语音的准干净语音功率谱。2. 根据权利要求1所述的用于语音质量客观评价的准干净语音构造方法,其特征在 于,在步骤1中,所述改进的最小值控制递归平均算法基于非语音段与语音段的划分;把非 语音段认定为噪声,噪声谱估计值〇(入_1〇 = |¥〇_1〇|2,其中,|¥0_1〇|2为非语音 帧短时功率谱,Xuv为非语音段的帧数索引,k为频带索引。3. 根据权利要求1所述的用于语音质量客观评价的准干净语音构造方法,其特征在 于,在步骤2中,所述改进的最小值控制递归平均算法对语音帧进行噪声估计时,采用的频 率相关阈值S(k)的定义为:其中,LF和MF分别对应IkHZ和3kHZ的频点,Fs为采样频率,k为本文档来自技高网
...
一种用于语音质量客观评价的准干净语音构造方法

【技术保护点】
一种用于语音质量客观评价的准干净语音构造方法,其特征在于,包括以下步骤:步骤1、改进的最小值控制递归平均算法在失真语音的噪声谱估计中区分非语音段与语音段,根据非语音段的特性更新非语音段的噪声谱估计值;步骤2、对语音帧进行噪声估计时,改进的最小值控制递归平均算法在确定语音帧频带语音存在概率时,采用新的频率相关阈值;步骤3、改进的最小值控制递归平均算法根据非语音段和语音段的噪声功率谱估计确定最终带噪语音的噪声功率谱估计值;步骤4、改进的最小值控制递归平均算法采用语音活动检测方式划分非语音段与语音段,利用过零率和短时能量时域特征,sohn算法分别确定失真语音的语音段以及语音段中的话间非语音段;步骤5、多带谱减法根据非语音段与语音段的划分和对应的噪声谱估计值,分别计算准干净语音的非语音段与语音段的准干净功率谱,从而获得失真语音的准干净语音功率谱。

【技术特征摘要】

【专利技术属性】
技术研发人员:贺前华周伟力李洪韬
申请(专利权)人:华南理工大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1