当前位置: 首页 > 专利查询>皇家KPN公司专利>正文

用于确定音频系统的感知质量的方法和系统技术方案

技术编号:7573632 阅读:168 留言:0更新日期:2012-07-15 08:22
本发明专利技术涉及一种用于关于参考信号确定质量指标的方法,该质量指标代表音频系统的输出信号的感知质量。处理和比较参考信号和输出信号。该处理包括将参考信号和输出信号划分成相互对应的时间帧。此外,该处理包括将参考信号的强度缩放成固定声强级、并且然后对缩放的参考信号内的时间帧执行测量用于确定参考信号时间帧特性。然后将参考信号的强度从固定声强级缩放成与输出信号有关的声强级。另外,在该方法中,在感知响度域中将输出信号的响度缩放成固定响度级。这一缩放动作使用参考信号时间帧特性。最后,在感知响度域中将参考信号的响度从与输出信号有关的声强级对应的响度级缩放成与缩放的输出信号的响度级有关的响度级。这一缩放动作也使用参考信号时间帧特性。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种用于关于参考信号确定质量指标的方法,该质量指标代表音频系统(例如语音处理设备)的输出信号的感知质量。本专利技术还涉及一种包括例如存储于计算机可读介质上的计算机可执行代码的计算机程序产品,该计算机可执行代码适于在由处理器执行时执行这样的方法。最后,本专利技术涉及一种用于关于音频系统的用作参考信号的输入信号确定质量指标的系统,该质量指标代表音频系统的输出信号的感知质量。
技术介绍
可以主观或者客观地确定音频设备的质量。主观测试耗费时间、昂贵并且难以再现。因此已经开发若干方法以客观方式测量音频设备的输出信号(特别是语音信号)的质量。在这样的方法中,通过与参考信号比较来确定如从语音信号处理系统接收的输出信号的语音质量。广泛用于这一目的的当前方法是在标题为“Perceptual evaluation of speech quality (PESQ): An objective method for end-to-end speech quality assessment of narrow-band telephone networks and speech codecs,,的 ITU-T Recommendation P.862 中描述的方法。在ITU-T Recommendation P. 862中将确定来自语音信号处理系统的输出信号(该信号一般失真)的质量。输出信号和参考信号(例如语音信号处理系统的输入信号) 根据人类听觉系统的心理-生理(psycho-physical)感知模型映射到表示信号。基于这些信号,确定差分信号,该差分信号代表如与参考信号相比的输出信号内的失真。通常将代表输出信号的感知质量的质量指标定义为指标,该指标示出与主观感知的语音质量的高相关性。通常将质量指标表达为如在主观测试中确定的平均意见分数(M0S),其中主体(人)按照质量标度表达他们的意见。一般而言,从受测试设备的输出信号的内部表示与到受测试设备的输入信号的内部表示的比较导出质量指标。可以通过将信号从外部物理域变换到内部心理生理域来计算内部表示。在ITU-T Recommendation P. 862中,在心理生理信号表示的计算中使用的算法的核心由以下主要操作组成缩放成固定级、时间对准、从幅度-时间域变换到功率-时间-频率域、功率和频率标度的规整(warping)。操作导致按照响度-时间-音调的内部表示,可以根据该内部表示计算差值函数。这些差值函数然后用来导出单个质量指标。对于每个语音文件,人们因此可以导出MOS分数和质量指标分数,这些分数应当具有在它们之间的最高可能相关性。作为例子,可以通过比较语音编解码器的输出的内部表示与编解码器的输入的内部表示来确定编解码器的质量。对于编解码器编码的每个语音文件,质量指标将产生数字,该数字应当具有与用于该编/解码语音文件的主观确定的 MOS分数的高相关性。然后根据其中已经对基于测试的人类听力感知的某些性质建模的认知模型处理差分信号以获得质量信号,该质量信号是输出信号的听觉感知的质量测量。如ITU-T Recommendation P. 862清楚指示的那样,已知PESQ在使用于可变听力水平(listening level)时提供不准确预测。PESQ假设79dB SPL (声压级)的标准听力水平并且补偿输入信号中的非最优信号电平。因此未考虑从最优听力水平偏离的主观影响。在当今电信系统(特别是使用IP语音(VOIP)和相似技术的系统)中,经常出现非最优听力水平。因而PESQ常常未提供在变得越来越流行的这样的电信系统中处理的语音信号的最优感知预测。
技术实现思路
希望具有一种确定音频系统的传输质量的方法,该方法提供在如客观测量确定的语音质量与如在主观测试中确定的语音质量之间的改进的相关性。出于这一目的,本专利技术的一个实施例涉及一种用于关于参考信号确定质量指标的方法,该质量指标代表音频系统 (例如语音处理设备)的输出信号的感知质量,其中处理和比较参考信号和输出信号,并且该处理包括将参考信号和输出信号划分成相互对应的时间帧,其中该处理还包括将参考信号的强度缩放成固定声强级(intensity level);对缩放的参考信号内的时间帧执行测量用于确定参考信号时间帧特性;将参考信号的强度从固定声强级缩放成与输出信号有关的声强级;在感知响度域中将输出信号的响度缩放成固定响度级,输出信号响度缩放使用参考信号时间帧特性;并且在感知响度域中将参考信号的响度从与输出信号有关的声强级对应的响度级缩放成与缩放的输出信号的响度级有关的响度级,参考信号响度缩放使用参考信号时间帧特性。在某些实施例中,将参考信号的强度从固定声强级缩放成与输出信号有关的声强级是基于参考信号与缩放因子相乘,缩放因子通过以下来定义为多个时间帧确定平均参考信号声强级;为与参考信号的用来确定平均参考信号声强级的时间帧对应的多个时间帧确定平均输出信号声强级;通过基于平均参考信号声强级和平均输出信号声强级确定分数来导出预备缩放因子;如果预备缩放因子小于阈值,则通过将缩放因子定义成等于预备缩放因子、否则等于用附加的依赖于预备缩放因子的值递增的预备缩放因子来确定缩放因子。在本专利技术的一些实施例中,在输出电平到固定响度级的响度缩放之前,该方法还包括针对参考信号的具有比输出信号的响度级高的响度级的部分将参考信号的响度级局部缩放成输出信号的响度级;并且随后针对输出信号的具有比参考信号的响度级高的响度级的部分将输出信号的响度级局部缩放成参考信号的响度级。这些局部缩放动作的分离允许归因于时间限幅(time clipping)和脉冲的电平变化的分开实现和/或操纵。在本专利技术的一些实施例中,该处理还包括将缩放的参考信号和输出信号从时域变换到时间-频率域;根据参考信号导出参考音调功率密度函数并且根据输出信号导出输出音调功率密度函数,所述声强级差对应于音调功率密度函数的声强级之间的差;局部缩放参考音调功率密度函数以获得局部缩放的参考音调功率密度函数;关于频率部分地补偿局部缩放的参考音调功率密度函数;导出参考响度密度函数和输出响度密度函数,所述响度级差对应于响度密度函数的响度级之间的差;其中响度密度函数代表实现量化可变电平回放对感知质量的影响的密度函数。在又一实施例中,该方法还包括对参考音调功率密度函数和输出音调功率密度函数中的至少一个执行激励操作。这样的激励操作可以允许补偿由于执行对这些信号执行的变换动作的频率分量模糊(smearing)。该处理还可以包括关于频率补偿局部缩放的参考音调功率密度函数和补偿局部缩放的参考响度密度函数中的至少一个,其包括基于参考信号时间帧特性估计语音处理系统的线性频率响应。例如仅使用具有超过某一阈值的平均声强级的时间帧可以改进这些动作的性能。在本专利技术的一些实施例中,感知响度域中的参考信号在缩放成与感知响度域中的输出信号的响度级有关的响度级之前受到用于将噪声抑制直至预定噪声电平的噪声抑制动作。预定噪声电平可以对应于如下噪声电平,该噪声电平被视为期望的如下低噪声电平, 该低噪声电平用作用于输出信号的理想表示。类似地或者此外,感知响度域中的输出信号在缩放成固定响度级之前可以受到用于将噪声抑制直至代表干扰的噪声电平的噪声抑制算法。输出信号的噪声抑本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:J比伦德斯J范武格特
申请(专利权)人:皇家KPN公司荷兰应用自然科学研究组织
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术