一种LTE通信系统语音质量的评估方法技术方案

技术编号:11385109 阅读:114 留言:0更新日期:2015-05-01 11:58
本发明专利技术公开了一种LTE通信系统语音质量的评估方法,包括以下步骤:获取模型参数;实时评估语音质量。本发明专利技术应用统计分析和最小二乘拟合技术,提出了“语音实际损失时间”的概念和计算方法,使得改进后的E-Model模型的均方误差基本不随丢包率改变而改变,且一直维持在较低的水平,提高语音质量评估的准确性。本发明专利技术致力于实时评估LTE通信系统中语音通信的质量,本发明专利技术的输出结果可以指导LTE通信系统自适应地进行调度控制和无线资源分配,并满足用户更高的通信体验需求。本发明专利技术主要改进了网络丢包对语音质量的影响,并用语音的实际损失时间来代替丢包率和突发比率,用于语音质量评价,排除了静音数据包对语音质量评价的影响。

【技术实现步骤摘要】

本专利技术涉及一种语音质量评估技术,特别是一种LTE通信系统语音质量的评估方法
技术介绍
长期演进(Long-Term Evolution,LTE)系统是第三代合作伙伴计划(3rd Generation Partnership Project,3GPP)对包括核心网在内的第三代移动通信网络的全面演进系统,它采用了一些先进技术,包括正交频分复用技术、多输入多输出技术(MIMO)、以波束成型为主的智能天线技术、调制和编码链路自适应技术(AMC)等。在接入网层面,LTE通信系统主要由空中无线接口和无线接入网两部分组成。在下行链路,LTE通信系统采用正交频分复用多址接入(OFDMA)技术;在上行链路,则采用单载波-频分复用多址接入(SC-FDMA)技术。在核心交换层面,LTE通信系统全面采用IP网络来承载语音通信和其它通信业务。LTE通信系统采用了先进的无线接入技术和IP网络技术,可显著提升语音通信质量和数据传输速率。语音通信服务是LTE通信系统的基础业务,话音质量是衡量语音通信服务水平的一项重要指标。为了保证较高的语音质量,在LTE通信系统中,通信资源的调度、分配、控制策略极为重要,特别是要根据当前LTE通信系统的语音质量对无线资源进行灵活的管理。为了对移动通信网络的语音质量进行评价,ITU-T G.107标准给出了基于E-Model模型的语音质量客观评估技术,该技术考虑了通话延时、回声、噪声等语音通信中存在的性能损失,也在一定程度上考虑了抖动、丢包等分组网络中特有的问题。下面对现有E-Model模型进行描述:一、主观MOS评价主观评价是通过人的主观感受来划分语音质量的等级,进而衡量语音质量的方法。它直接反映了评价者对语音质量的主观印象,符合人类对语音质量的真实感受。在MOS(Mean Opinion Scores,平均意见得分)评分法中,参加语音质量评价的测试人员对待测语音进行评分,分数根据表1分为5个等级;然后,将所有测试人员的平均分数作为所测语音质量的MOS分数。由于人的心理等主观因素以及客观环境的不断变化,每次测试出的MOS分数结果都不尽相同,并且存在波动。为了抑制这种波动,参与评分的人数需40人以上,而且待测的语音数据应该包括男声、女声以及童声等各种类型,测试环境也要尽量保持相同。主观评价过程费时、费力且易受主观感受的影响,难以实现对语音的实时评测。作为一种很好的近似,实际常用ITU-T P.862标准[Perceptual evaluation of speech quality(PESQ):An objective method for end-to-end speech quality assessment of narrow-band telephone networks and speech codecs]的PESQ方法近似获得MOS分数。表1 MOS分值标准MOS分质量级别失真级别4.0-5.0优(Excellent)不觉察3.5-4.0良(Good)刚有觉察3.0-3.5可(Fair)有觉察且刚觉可厌1.5-3.0差(Poor)明显觉察且可厌但可忍受0-1.5不可接受(Unacceptable)不可忍受二、E-Model语音评估模型E-Model是ITU-T G.107标准提出的语音质量评价模型,它充分考虑了通话延时、回声和噪声等语音通信中存在的性能损失,也在一定程度上考虑了抖动和丢包等分组网络中特有的问题,适用于IP网络电话这类影响因素比较多的语音通信环境。该方法先根据网络延时、噪声、语音编解码器等参数,计算出传输性能等级系数R,再将R转化为等效的MOS分值。传输性能等级系数R的表达式为:R=R0-Is-Id-Ie-eff+A其中,R0表示基本信噪比,包括电路噪声和室内噪声;Is表示近似与声音传输同步的损耗;Id表示延时修复因子,包括呼叫方和接收方两方面回声的影响以及端到端传输导致的延时;Ie-eff表示设备损耗因子,包括低速率语音编解码以及网络丢包所造成的损伤;A表示由通信系统所产生的损伤补偿。下面对这些参数进行详细说明。(1)基本信噪比R0影响R0的主要因素包括:响度评测值,包括发送端响度评测值SLR,接收端响度评测值RLR,背景噪声,包括发送端噪声Ps,接收端噪声Pr,电话延时值,包括发送端延时Ds,接收端延时Dr,说话者回音响度额定值TELR。R0=15-1.5[SLR+10log10(10Nc10+10Nos10+10Nor10+10Nfo10)]]]>其中:①Nc表示电路引起的所有噪声功率之和。②Nos表示发送端背景噪声引起的电路噪声,即Nos=Ps-SLR-Ds-100+0.004(Ps-SLR-RLR-Ds-14)2OLR=SLR+RLR③Nor表示接收端背景噪声引起的电路噪声Nor=RLR-121+Pre+0.008(Pre-35)2Pre=Pr+10log[1+1010-LSTR10]]]>这里,LSTR=STMR+D,STMR表示掩蔽电话侧音能力的评级。④Nfo表示接收端的噪声,即Nfo=RLR-64dBmp(2)同步损伤系数IsIs表示语音实时传输所产生的同步损伤。影响Is的主要因素有:话音响度,说话人回声响度,单向延时时间(T)以及定点化引起的量化失真度qdu。Is的表达式为:Is=Iolr+Ist+Iq其中:①Iolr表示由于话音响度太低而引起的话音质量损耗,即Iolr=20[{1+(Xolr8)8本文档来自技高网...

【技术保护点】
一种LTE通信系统语音质量的评估方法,其特征在于:包括以下步骤:A、获取模型参数;A1、计算语音实际损失长度;考虑某个语音片段的传输过程,语音采样频率为8kHz,每个样本用16比特精度量化;假设该语音片段所需要传输的语音包有n个,包的序号分别为1、2、…、n,包的载荷部分长度分别为l1、l2、…、ln,所采用的编码器的压缩比分别为r1、r2、…、rn,无语音编码的原始语音码速率为Rnoncodec=8000×16=128kbit/s,丢失的网络包的序号为x1、x2、…、xm,m≤n;那么语音的实际损失时间Tloss为:Tloss=Σi=1mlxirxiRnoncodec---(1)]]>下面寻找语音实际损失时间Tloss与E‑Model模型的R值之间的映射关系,再将这一关系引入设备损伤系数Ie‑eff中;A2、训练语音制备;从ITU‑T P系列标准语音数据库supplement23中,随机选取10个男声和10个女声,共20个语音文件,并以连续、完整为标准标记语音片段;A3、丢包语音数据包生成;对这些语音片段进行模拟丢包处理,丢包率范围控制在20%以内;一种简单方法为:定义随机数种子seed,其第n次迭代的值为:seed(n)=[2045·seed(n‑1)+1]MOD 1048576,这里,MOD表示取模,初始值seed(0)=12357;seed的迭代次数与数据包的序号对应,要取得丢包率为q,则当seed(n)<1048576·q时,将对应序号数据包设置为丢包;A4、MOS分数计算;用ITU‑T P.862标准的PESQ评价方法对丢包后语音片段的语音质量进行评价,得出相应的MOS分数;A5、传输性能等级系数R计算;根据式(2),通过MOS分数得到E‑Model模型中对应的R值;MOS=1,R<6.50+0.035R+R(R-60)(100-R×7×10-6),6.5<R<1004.5,R>100---(2)]]>A6、丢包损失因子Iloss计算;Iloss=93.2‑RA7、实际损失时间Tloss计算;根据式(1),通过训练语音和丢包语音计算出语音实际损失时间Tloss;A8、Tloss和Iloss之间的关系曲线通过多项式进行拟合;Iloss=f(Tloss)=aTloss3+bTloss2+cTloss+d]]>考虑到语音的短时平稳性以及人的发声特点,一段完整语音片段的波形通常都会经历由弱变强、幅度持续和由强变弱这三个阶段,且这三个阶段的语音丢包对语音质量的影响不同;其中,a~d为多项式系数,通过分段最小二乘拟合方法,分别得到语音在由弱变强、幅度持续和由强变弱三个阶段中Tloss和Iloss间的映射关系及相应系数a~d的具体数值;拟合出的多项式系数将用于语音质量实时评估过程中;表4给出了语音在三个阶段中Tloss和Iloss的整体映射关系,表5给出了语音在三个阶段中Tloss和Iloss的分段映射关系;当语音损失时间为0时,对应的Iloss值为0,不参与计算;当语音损失时间超过500ms时,已无法进行正常通话,Iloss取90以上的值,对应的E‑Model评估MOS分数为1;表4 语音三个阶段中Tloss和Iloss的整体映射关系表5 语音三个阶段中Tloss和Iloss的分段映射关系B、实时评估语音质量;实时评估语音质量的方法步骤如下:B1、计算实际损失时间Tloss;B11、提取语音片段:根据网络数据包的语音/静音标记,提取静音包之间连续的语音包作为一次评估的语音片段;通过系统配置文件和系统实时网络包的反馈信息获得评估所需信息,包括网络包的编解码方式、载荷长度、时间戳、语音/静音标记以及是否丢包的标记;B12、计算语音实际损失时间:根据语音包的是否丢包标记、载荷长度和编解码方式信息,用式(1)计算出语音实际损失时间Tloss;B2、计算Iloss;根据表4或表5中Tloss和Iloss的映射关系,由Tloss计算出Iloss;B3、基于改进的E‑Model模型进行MOS分数计算;在改进的E‑Model模型中,Ie‑eff变为:Ie‑eff=Ie+Iloss=Ie+f(Tloss),从E‑Model模型的配置文件中,读取相关的默认参数,并对E‑Model模型进行初始化;根据语音包的是否丢包标记、载荷长度和编解码方式信息,结合改进的E‑Model模型算法,计算传输等级因子R,并将其换算为相应的MOS分数。...

【技术特征摘要】
1.一种LTE通信系统语音质量的评估方法,其特征在于:包括以下步骤:
A、获取模型参数;
A1、计算语音实际损失长度;
考虑某个语音片段的传输过程,语音采样频率为8kHz,每个样本用16比特
精度量化;假设该语音片段所需要传输的语音包有n个,包的序号分别为1、
2、…、n,包的载荷部分长度分别为l1、l2、…、ln,所采用的编码器的压缩比
分别为r1、r2、…、rn,无语音编码的原始语音码速率为Rnoncodec=8000×16=128kbit/s,
丢失的网络包的序号为x1、x2、…、xm,m≤n;那么语音的实际损失时间Tloss为:
Tloss=Σi=1mlxirxiRnoncodec---(1)]]>下面寻找语音实际损失时间Tloss与E-Model模型的R值之间的映射关系,再
将这一关系引入设备损伤系数Ie-eff中;
A2、训练语音制备;
从ITU-T P系列标准语音数据库supplement23中,随机选取10个男声和10
个女声,共20个语音文件,并以连续、完整为标准标记语音片段;
A3、丢包语音数据包生成;
对这些语音片段进行模拟丢包处理,丢包率范围控制在20%以内;一种简
单方法为:定义随机数种子seed,其第n次迭代的值为:
seed(n)=[2045·seed(n-1)+1]MOD 1048576,
这里,MOD表示取模,初始值seed(0)=12357;seed的迭代次数与数据包的
序号对应,要取得丢包率为q,则当seed(n)<1048576·q时,将对应序号数据
包设置为丢包;
A4、MOS分数计算;
用ITU-T P.862标准的PESQ评价方法对丢包后语音片段的语音质量进行评
价,得出相应的MOS分数;
A5、传输性能等级系数R计算;
根据式(2),通过MOS分数得到E-Model模型中对应的R值;
MOS=1,R<6.50+0.035R+R(R-60)(100-R×7×10-6),6.5<R<1004.5,R>100---(2)]]>A6、丢包损失因子Iloss计算;
Iloss=93.2-R
A7、实际损失时间Tloss计算;
根据式(1),通过训练语音和丢包语音计算出语音实际损失时间Tloss;
A...

【专利技术属性】
技术研发人员:陈喆殷福亮王冰倩贺锐
申请(专利权)人:大连理工大学
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1