语音质量评估的方法和装置制造方法及图纸

技术编号:16286933 阅读:44 留言:0更新日期:2017-09-25 10:06
本发明专利技术实施例提供一种语音质量评估的方法和装置。该方法包括:接收待检测信号,根据待检测信号的编码速率,获取语音质量评估基准分值,对待检测信号进行质量损伤评估处理,获取质量损伤评估值,根据语音质量评估基准分值和质量损伤评估值的差值,获取待检测信号对应的语音质量最终评估分值。本发明专利技术实施例提供的语音质量评估的方法和装置,实现了对网络传输的语音码流信号进行实时语音质量评估,从而可实现对网络情况进行实时监控,同时提高了网络性能评估效率。

Method and apparatus for speech quality assessment

The embodiment of the invention provides a method and a device for evaluating speech quality. The method comprises: receiving the detected signal according to the detected signal encoding rate, obtain the evaluation of speech quality benchmark scores, quality assessment of injury treated detection signal, obtaining the quality damage assessment value, according to the difference between the benchmark score and quality evaluation of damage valuation evaluation of speech quality, get the test signal corresponding to the speech quality of the final evaluation score. Method and apparatus for speech quality assessment provided by the embodiment of the invention, the realization of the speech signal stream to the network transmission of real-time speech quality assessment, which can realize the real-time monitoring of network, and improve the efficiency of network performance evaluation.

【技术实现步骤摘要】

本专利技术实施例涉及通信
,尤其涉及一种语音质量评估的方法和装置
技术介绍
语音质量评估可分为主观语音评估和客观语音评估两种,主观语音评估是以人为主体根据某种预先约定的规则来对失真语音或参考原始语音划分质量等级,它反映了评听者对语音质量好坏程度的一种主观印象。客观语音评估采用机器自动判别语音质量,它使用某个特定的参数去表征语音通过编码或传输系统后的失真程度,并以此来评估处理系统的性能优劣。另外,对于客观语音评估,目前主要采用语音质量感知评估(PerceptualEvaluationofSpeechQuality,以下简称PESQ),具体的,通过对参考信号和失真信号分别进行电平调整,再用输入滤波器模拟标准电话扬声器分别对电平调整后的参考信号和失真信号进行滤波,然后对通过电平调整和滤波后的上述两个信号在时间上对准,再对时间上对准后的两个信号分别进行听觉变换,最后分析2个听觉变换后的信号之间的扰动曲面,以提取出对称干扰和非对称干扰2个失真参数,在对这2个失真参数频率和时间上进行累积,并将累计后的值与主观平均意见分的预测值相比较,得到PESQ得分。其中,失真信号是参考信号在进入到测试系统后得到的信号。但是,由于PESQ是一种波形域侵入式非实时语音质量评估方法,因此要求输入的信号必须是波形域信号,且还需要提供参考信号,才能进行语音质量评估,这样就对评估条件有严格限制。另外,还需要将待评估信<br>号进行完整录音后再进行质量评估,从而无法对语音质量进行实时评估。
技术实现思路
本专利技术实施例提供一种语音质量评估的方法和装置,以实现对网络传输的语音码流信号进行非侵入式线上实时语音质量评估,不需要参考信号,同时实现了对网络情况进行实时监控。第一方面,本专利技术实施例提供一种语音质量评估的方法,包括:接收待检测信号;根据所述待检测信号的编码速率,获取语音质量评估基准分值;对所述待检测信号进行质量损伤评估处理,获取质量损伤评估值;根据所述语音质量评估基准分值和所述质量损伤评估值的差值,获取所述待检测信号对应的语音质量最终评估分值。在第一方面的第一种可能的实施方式中,当所述待检测信号包括下行码流信息,或者上行码流信息和下行码流信息时,所述对所述待检测信号进行质量损伤评估处理,获取质量损伤评估值,包括如下一种或者几种组合:对所述下行码流信息进行削波损伤质量评估处理,获取削波损伤值;对所述下行码流信息进行丢帧损伤质量评估处理,获取丢帧损伤值;对所述下行码流信息进行杂音损伤质量评估处理,获取当前帧的杂音损伤值;对所述下行码流信息进行噪声损伤质量评估处理,获取噪声损伤值;对所述下行码流信息进行单通损伤质量评估处理,获取当前帧的单通损伤值;和对所述下行码流信息进行延迟损伤质量评估处理,获取延迟损伤值。结合第一方面的第一种可能的实施方式,在第一方面的第二种可能的实施方式中,当所述待检测信号包括上行码流信息和下行码流信息时,所述对所述待检测信号进行质量损伤评估处理,获取质量损伤评估值,还包括:对所述下行码流信息和上行码流信息进行回声损伤质量评估处理,获取回声损伤值。结合第一方面,在第一方面的第三种可能的实施方式,当所述待检测信号包括上行码流信息时,所述对所述待检测信号进行质量损伤评估处理,获取质量损伤评估值,包括如下一种或者几种组合:对所述上行码流信息进行削波损伤质量评估处理,获取削波损伤值;对所述上行码流信息进行丢帧损伤质量评估处理,获取丢帧损伤值;对所述上行码流信息进行杂音损伤质量评估处理,获取当前帧的杂音损伤值;对所述上行码流信息进行噪声损伤质量评估处理,获取噪声损伤值;对所述上行码流信息进行单通损伤质量评估处理,获取当前帧的单通损伤值;和对所述上行码流信息进行延迟损伤质量评估处理,获取延迟损伤值。结合第一方面的第一种可能的实施方式或第一方面的第三种可能的实施方式,在第一方面的第四种可能的实施方式中,所述对所述下行码流信息或上行码流信息进行削波损伤质量评估处理,获取削波损伤值,包括:在判断出所述下行码流信息或上行码流信息存在削波信号时,采用公式M_Clip=Aclip×long-time-clip-percent,获取削波损伤值M_Clip;其中,long-time-clip-percent为检测到的长时削波百分比,Aclip为削波损伤因子。结合第一方面的第一种可能的实施方式或第一方面的第三种可能的实施方式,在第一方面的第五种可能的实施方式中,所述对所述下行码流信息或上行码流信息进行丢帧损伤质量评估处理,获取丢帧损伤值,包括:在判断出所述下行码流信息或上行码流信息存在丢帧信号时,采用公式M_FER=A*Packet_loss_rate+B+C*(ConsecutiveLossCount-D),]]>获取丢帧损伤值M_FER;其中,A、B、C、D为丢帧损伤因子,A、B随着编解码的码率不同会有差别,Packet_loss_rate为检测到的丢包率,Consecutive_Loss_Count为检测到的长时连续丢包率。结合第一方面的第一种可能的实施方式或第一方面的第三种可能的实施方式,在第一方面的第六种可能的实施方式中,所述对所述下行码流信息或上行码流信息进行杂音损伤质量评估处理,获取当前帧的杂音损伤值,包括:在判断出所述下行码流信息或上行码流信息存在杂音信号时,设置当前帧的杂音损伤值M_Glitchn=Aglith;在判断出所述下行码流信息或上行码流信息不存在杂音信号时,设置当前帧的杂音损伤值M_Glitchn=αupdate_glith×M_Glithn-1;或者,其中,αupdate_glith为杂音损伤更新因子,M_Glithn-1为前一帧的杂音损伤,Aglith为杂音损伤因子。结合第一方面的第一种可能的实施方式或第一方面的第三种可能的实施方式,在第一方面的第七种可能的实施方式中,所述对所述下行码流信息或上行码流信息进行噪声损伤质量评估处理,获取噪声损伤值,包括:在判断出所述下行码流信息或上行码流信息存在噪声信号时,采用公式M_Noise=Anoise/long_time_snr+Bnoise,]]>获取噪声损伤值M_Noise;其中,Anoise和Bnoise为噪声损伤因子,long_time_snr为检测到的长时信噪比。结合第一方面的第一种可能的实施方式或第一方面的第三种可能的实施方式,在第一方面的本文档来自技高网
...

【技术保护点】
一种语音质量评估的方法,其特征在于,包括:接收待检测信号;根据所述待检测信号的编码速率,获取语音质量评估基准分值;对所述待检测信号进行质量损伤评估处理,获取质量损伤评估值;根据所述语音质量评估基准分值和所述质量损伤评估值的差值,获取所述待检测信号对应的语音质量最终评估分值。

【技术特征摘要】
1.一种语音质量评估的方法,其特征在于,包括:
接收待检测信号;
根据所述待检测信号的编码速率,获取语音质量评估基准分值;
对所述待检测信号进行质量损伤评估处理,获取质量损伤评估值;
根据所述语音质量评估基准分值和所述质量损伤评估值的差值,获取所
述待检测信号对应的语音质量最终评估分值。
2.根据权利要求1所述的语音质量评估的方法,其特征在于,当所述待
检测信号包括下行码流信息,或者上行码流信息和下行码流信息时,所述对
所述待检测信号进行质量损伤评估处理,获取质量损伤评估值,包括如下一
种或者几种组合:
对所述下行码流信息进行削波损伤质量评估处理,获取削波损伤值;
对所述下行码流信息进行丢帧损伤质量评估处理,获取丢帧损伤值;
对所述下行码流信息进行杂音损伤质量评估处理,获取当前帧的杂音损
伤值;
对所述下行码流信息进行噪声损伤质量评估处理,获取噪声损伤值;
对所述下行码流信息进行单通损伤质量评估处理,获取当前帧的单通损
伤值;和
对所述下行码流信息进行延迟损伤质量评估处理,获取延迟损伤值。
3.根据权利要求2所述的语音质量评估的方法,其特征在于,当所述待
检测信号包括上行码流信息和下行码流信息时,所述对所述待检测信号进行
质量损伤评估处理,获取质量损伤评估值,还包括:
对所述下行码流信息和上行码流信息进行回声损伤质量评估处理,获取
回声损伤值。
4.根据权利要求1所述的语音质量评估的方法,其特征在于,当所述待
检测信号包括上行码流信息时,所述对所述待检测信号进行质量损伤评估处
理,获取质量损伤评估值,包括如下一种或者几种组合:
对所述上行码流信息进行削波损伤质量评估处理,获取削波损伤值;
对所述上行码流信息进行丢帧损伤质量评估处理,获取丢帧损伤值;
对所述上行码流信息进行杂音损伤质量评估处理,获取当前帧的杂音损

\t伤值;
对所述上行码流信息进行噪声损伤质量评估处理,获取噪声损伤值;
对所述上行码流信息进行单通损伤质量评估处理,获取当前帧的单通损
伤值;和
对所述上行码流信息进行延迟损伤质量评估处理,获取延迟损伤值。
5.根据权利要求2或4所述的语音质量评估的方法,其特征在于,所述
对所述下行码流信息或上行码流信息进行削波损伤质量评估处理,获取削波
损伤值,包括:
在判断出所述下行码流信息或上行码流信息存在削波信号时,采用公式
M_Clip==Aclip×long-time-clip-percent,获取削波损伤值M_Clip;
其中,long-time-clip-percent为检测到的长时削波百分比,Aclip为削波
损伤因子。
6.根据权利要求2或4所述的语音质量评估的方法,其特征在于,所述
对所述下行码流信息或上行码流信息进行丢帧损伤质量评估处理,获取丢帧
损伤值,包括:
在判断出所述下行码流信息或上行码流信息存在丢帧信号时,采用公式
M_FER=A*Packet_loss_rate+B+C*(ConsecutiveLossCount-D),]]>获取丢帧
损伤值M_FER;
其中,A、B、C、D为丢帧损伤因子,A、B随着编解码的码率不同会有
差别,Packet_loss_rate为检测到的丢包率,ConsecutiveLossCount为检测到
的长时连续丢包率。
7.根据权利要求2或4所述的语音质量评估的方法,其特征在于,所述
对所述下行码流信息或上行码流信息进行杂音损伤质量评估处理,获取当前
帧的杂音损伤值,包括:
在判断出所述下行码流信息或上行码流信息存在杂音信号时,设置当前
帧的杂音损伤值M_Glitchn=Aglith;或者,
在判断出所述下行码流信息或上行码流信息不存在杂音信号时,设置当
前帧的杂音损伤值M_Glitchn=αupdate_glith×M_Glithn-1;
其中,αupdate_glith为杂音损伤更新因子,M_Glithn-1为前一帧的杂音损伤,

\tAglith为杂音损伤因子。
8.根据权利要求2或4所述的语音质量评估的方法,其特征在于,所述
对所述下行码流信息或上行码流信息进行噪声损伤质量评估处理,获取噪声
损伤值,包括:
在判断出所述下行码流信息或上行码流信息存在噪声信号时,采用公式
M_Noise=Anoise/long_time_snr+Bnoise,]]>获取噪声损伤值M_Noise;
其中,Anoise和Bnoise为噪声损伤因子,long_time_snr为检测到的长时信噪比。
9.根据权利要求2或4所述的语音质量评估的方法,其特征在于,所述
对所述下行码流信息或上行码流信息进行单通损伤质量评估处理,获取当前
帧的单通损伤值,包括:
在判断出所述下行码流信息或上行码流信息存在单通信号时,设置当前
帧的单通损伤值M_one_wayn=Aone_way;或者,
在判断出所述下行码流信息或上行码流信息不存在单通信号时,设置当
前帧的单通损伤值M_one_wayn=αupdate_one_way×M_one_wayn-1;
其中,αupdate_one_way为单通损伤更新因子,M_one_wayn-1为前一帧的单通
损伤,Aone_way为单通损伤因子。
10.根据权利要求2或4所述的语音质量评估的方法,其特征在于,所
述对所述下行码流信息或上行码流信息进行延迟损伤质量评估处理,获取延
迟损伤值,包括:
根据获取到的网络默认延迟Tdefault和网络当前延迟T,采用公式
M_Delay=αdelay×(T—Tdefault),获取延迟损伤值M_Delay;
其中,αdelay是延迟损伤因子。
11.根据权利要求3所述的语音质量评估的方法,其特征在于,所述对
所述下行码流信息和上行码流信息进行回声损伤质量评估处理,获取回声损
伤值,包括:
在判断出所述下行码流信息和上行码流信息存在回声信号时,采用公式
M_Echo=long_time_echo_percent*basic_efect,获取回声损伤值M_Echo;
其中,
basic_effect=Aecho*log10(long_time_energy_ratio+Becho),
long_time_echo_percent为检测到的长时回声百分比,long_time_energy_ratio为
检测到的长时回声能量比,Aecho、Becho为回声损伤因子。
12.一种语音质量评估的装置,其特征在于,包括:
接收模块,用于接...

【专利技术属性】
技术研发人员:张德明张琦李海婷张梦晗
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1