客观语音质量评估中反映时间和语言失真的方法和系统技术方案

技术编号:3046394 阅读:240 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种客观语音质量评估技术,该技术通过模拟可能对整个语音质量评估起支配作用的失真对主观语音质量评估的影响,反映了这些失真的影响,从而考虑了在客观语音质量评估中语言的影响。

【技术实现步骤摘要】

本专利技术通常涉及通信系统,尤其涉及语音质量评估。
技术介绍
无线通信系统的性能从语音质量方面来说是可以度量的。在现有技术中,语音质量评估的技术有两种。第一种是主观技术(以下指“主观语音质量评估”)。在主观语音质量评估中,典型的方法是利用听众对经过处理的语音进行质量评估,该语音是经接收器端处理的传输语音信号。该评估技术之所以是主观的,是因为它是建立在个人感知基础上的,而且由本地听众对语音质量的评价通常考虑到语言的影响,本地听众的母语就是提供的或倾听的语料的语言。研究表明主观听音测试的得分受到听众语言知识的影响。当语音中缺少语言信息即静音时,在主观听音测试中本地听众的打分低于非本地听众。在正常的电话交谈中,受话人通常是本地听众。这样,为了仿真典型的条件,在主观语音质量评估中使用本地听众更好一些。主观语音质量评估技术提供了语音质量的良好评价,但可能比较昂贵和费时。第二种技术是一种客观技术(以下指“客观语音质量评估”)。客观语音质量评估不是基于个人的感知。一些客观语音质量评估技术基于已知的源语音或从处理过的语音中估计重建的源语音。另一些客观语音质量评估技术则不是基于源语音而是仅仅基于处理过的语音。后一种技术在这里是指“单端客观语音质量评估技术”,通常应用于难以获得源语音或重建的源语音的场合。但是与主观语音质量评估技术相比,当前的单端客观语音质量评估技术不能提供同样良好的评价。当前的单端客观语音质量评估技术不如主观语音质量评估技术好的一个原因是前者没有考虑语言的影响。当前的单端客观语音质量评估技术在其语音评估过程中无法考虑语言的影响。因此,需要一种单端客观语音质量评估技术,能够在语音质量评估过程中考虑到语言的影响。
技术实现思路
本专利技术是一种客观语音质量评估技术,该技术通过模拟可能对整个语音质量评估起支配作用的失真对主观语音质量评估的影响,反映了这些失真的影响,从而考虑在客观语音质量评估中语言的影响。在本专利技术的一种实施方式中,该客观语音质量评估技术包含以下几个步骤用包络信息检测语音活动区间中的失真;以及修改与该语音活动关联的客观语音质量评估值,以反映这些失真对主观语音质量评估的影响。在本专利技术的一种实施方式中,该客观语音质量评估技术还区分出失真的类型,如短脉冲串、突然停顿和突然开始等,然后修改客观语音质量评估值,以反映每种失真对主观语音质量评估的不同影响。附图说明通过下面的描述、所附权利要求以及附图,本专利技术的特征、方式以及优越性都可以得到更好的理解,在附图中图1描述了根据本专利技术的一个实施例的一种考虑到语言影响的客观语音质量评估技术的流程图;图2描述了根据本专利技术的一个实施例的一个语音活动检测器的操作流程图,该检测器通过检查与语音信号关联的包络信息检测语音活动;图3是一个语音活动检测器活动的实例图解,该图分别示出了语音和非语音活动的间隔T和G;图4描述了一个实施例的流程图,该实施例确定语音活动是否是一个短脉冲串或脉冲噪声,而且当确定是短脉冲串或脉冲噪声时,修正语音帧的客观质量评估νs(m);图5描述了一个实施例的流程图,该实施例确定语音活动是否含有一个突然停顿或静音,而且当确定含有一个突然停顿或静音时,修正语音帧的客观质量评估νs(m);以及图6描述了一个实施例的流程图,该实施例确定语音活动是否含有一个突然开始,而且当确定含有一个突然开始时,修正语音帧的客观质量评估νs(m)。具体实施例方式本专利技术是一种客观语音质量评估技术,该技术通过模拟可能对整个语音质量评估起支配作用的失真对主观语音质量评估的影响,反映了这些失真的影响,从而考虑了在客观语音质量评估中语言的影响。图1描述了流程图100,说明按照本专利技术的一个实施例的考虑语言影响的客观语音质量评估技术。在步骤102中,处理语音信号s(n),以确定语音帧的客观质量评估νs(m),即语音在帧m的客观质量。在一个实施例中,每一帧m对应时间间隔64ms。处理语音信号S(n)以获得语音帧的客观质量评估νs(m)(不考虑语言的影响)的方法在本
是众所周知的。在下述共同待审申请中描述了这种处理方法的一个实例该申请的序列号是10/186,862,题目是“Compensation OfUtterance-Dependent Articulation For Speech Quality Assessment”,申请日为2002年7月1日,申请人是Doh-Suk Kim。在步骤105中,分析语音信号S(n)的语音活动,例如用语音活动检测器(VAD)。语音活动检测器在本
是众所周知的。图2描述了一个语音活动检测器的操作流程图200,该检测器通过检查与语音信号关联的包络信息检测语音活动。在步骤205中,将所有耳蜗通道k的包络信号γk(n)累加起来得到总的包络信号γ(n),见公式(1)所示γ(n)=Σk=1Ncbγk(n)]]>公式(1)其中,γ(n)=sk2(n)+s^k2(n),]]>n代表时间标号,Ncb代表临界带的总数,sk(n)代表语音信号s(n)通过第k个耳蜗通道的输出,也就是说,sk(n)=s(n)*hk(n), 是sk(n)的希尔伯特变换。在步骤210中,按照公式(2)将总包络信号γ(n)和4ms的汉明窗w(n)相乘,每2ms计算一个帧包络e(l),e(l)=log[Σn=031γ(l)(n)w(n)+1]]]>公式(2)其中,γ(l)(n)是总包络信号γ(n)第l个2ms帧信号。应该知道这里帧包络e(l)和汉明窗w(n)的持续时间仅仅用来举个例子,其他的持续时间是可能的。在步骤215中,按照公式(3)对帧包络e(l)进行向下取整(flooring)运算 公式(3)在步骤220中按照公式(4)得到向下取整的帧包络e(i)的时间导数△e(l): Δe(l)=Σj=-33je(l-j)Σj=-33j2]]>公式(4)其中-3≤j≤3。在步骤225中,按照公式(5)进行语音活动检测。公式(5)在步骤230中,公式(5)的结果即vad(l)可基于输出中0和1的持续时间进行改进。例如,如果在vad(l)中0的持续时间少于8ms,则vad(l)在该段时间内应改为1。与此类似,如果在vad(l)中1的持续时间少于8ms,则vad(l)在该段时间内应改为0。图3描述了一个语音活动检测器活动的实例图解,该图分别示出了语音和非语音活动的间隔T和G。应该知道间隔T相关的语音活动可以包含,比如说,真实语音、数据或噪音。回到图1的流程图100,在对语音信号s(n)的语音活动分析后,在步骤110中检查间隔T以确定相关的语音活动是否对应于短脉冲串或脉冲噪声。如果确定间隔T中的语音活动是短脉冲串或脉冲噪声,则在步骤115中修正语音帧的客观质量评估νs(m),得到修正的语音帧客观质量评估χs(m)。修正的语音帧客观质量评估χs(m)通过模拟或仿真短脉冲串或脉冲噪声对主观语音质量评估的影响,考虑了短脉冲串或脉冲噪声的影响。从步骤115或者如果在步骤110中确定间隔T中的语音活动不是短脉本文档来自技高网
...

【技术保护点】
一种客观评估语音质量的方法,包括以下步骤:使用包络信息检测语音活动区间中的失真;以及修正与该语音活动相联系的客观语音质量评估值,以反映所述失真对主观语音质量评估的影响。

【技术特征摘要】
US 2003-6-25 10/603,2121.一种客观评估语音质量的方法,包括以下步骤使用包络信息检测语音活动区间中的失真;以及修正与该语音活动相联系的客观语音质量评估值,以反映所述失真对主观语音质量评估的影响。2.根据权利要求1的方法,其中修正的步骤包括确定对语音活动的客观语音质量评估值的步骤。3.根据权利要求1的方法,其中所检测的失真是脉冲噪声、突然停顿或突然开始。4.根据权利要求1的方法,其中检测的步骤包括检测失真类型的步骤。5.根据权利要求4的方法,其中,如果包络信息指示出语音活动能够由听者感知为噪声,而且如果所述区间的持续时间足够长,能够让听者感知到,但又没有长到成为一个短脉冲串,那么失真的类型可以确定为脉冲噪声。6.根据权利要求4的方法,其中,如果包络信息指示出...

【专利技术属性】
技术研发人员:金度锡
申请(专利权)人:朗迅科技公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利