一种网络语音质量评估方法、装置和系统制造方法及图纸

技术编号：12386247 阅读：98 留言：0更新日期：2015-11-25 18:31

本发明专利技术实施例公开了一种网络语音质量评估方法、装置和系统。本发明专利技术实施例采用对获取到的网络语音的数据包进行解析，并根据解析结果确定该数据包的帧内容特性，比如确定是静音帧和语音帧，然后根据确定的帧内容特性对语音序列进行语句划分，并将语句划分为多个丢帧事件，在根据丢帧事件提取非语音参数后，根据该非语音参数按照预置的语音质量评估模型对每条语句的语音质量进行评估，最后，根据每条语句的语音质量评估整个语音序列的语音质量；采用该方案，可以大大地提高预测精度，提高评估结果的准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及通信
，具体涉及一种网络语音质量评估方法、装置和系统。
技术介绍
近年来，网络电话(VoIP，VoiceoverInternetProtocol)发展迅速，与传统电话相比，VoIP具有占用网络资源少、成本低等优势。然而网际协议(IP，InternetProtocol)网络只提供尽力而为的服务，语音在传输的过程中会受到丢包等多种网络因素的影响，造成网络语音质量的下降，通过对网络语音质量的监控和反馈，可以调整压缩或传输参数，改善网络语音质量。因此，如何对网络语音质量进行实时和准确可靠的测量与评估是网络测量和网络规划设计中相当关键的问题。根据模型输入信息类型以及对码流的介入程度，语音质量评估方法可以分为：参数规划模型、包层模型、比特流层模型、媒体层模型以及混合模型等；其中，基于包层模型的网络语音质量评估方法只允许通过分析语音数据包的包头信息评估语音的质量，其计算复杂度低，且适用于无法介入数据包载荷信息的情形。而基于比特流层模型的网络语音质量评估方法则不仅允许分析语音数据包的包头信息，而且还可以对语音负载信息进行分析，甚至可以进行语音解码，比如分析语音信号的波形，以获得更加详细的丢帧和失真信息，从而获得比基于包层模型的网络语音质量评估方法更加精确的预测质量，但是其计算复杂度交包层模型要高。因此，这两种方法各有其优势，是现有技术较为常用的两种网络语音质量评估方法。但是，不管是基于包层模型...
一种网络语音质量评估方法、装置和系统

【技术保护点】
一种网络语音质量评估方法，其特征在于，包括：获取网络语音的数据包，所述网络语音的数据包包括语音序列；对所述数据包进行解析，得到解析结果；根据所述解析结果确定所述数据包的帧内容特性，所述帧内容特性包括静音帧和语音帧；根据确定的帧内容特性对所述语音序列进行语句划分，并将划分得到的语句划分为多个丢帧事件；根据所述丢帧事件提取非语音参数，所述非语音参数包括位置参数和离散分布参数；根据所述非语音参数按照预置的语音质量评估模型对每条语句的语音质量进行评估，得到每条语句的语音质量；根据所述每条语句的语音质量评估所述语音序列的语音质量。

【技术特征摘要】
1.一种网络语音质量评估方法，其特征在于，包括：
获取网络语音的数据包，所述网络语音的数据包包括语音序列；
对所述数据包进行解析，得到解析结果；
根据所述解析结果确定所述数据包的帧内容特性，所述帧内容特性包括静
音帧和语音帧；
根据确定的帧内容特性对所述语音序列进行语句划分，并将划分得到的语
句划分为多个丢帧事件；
根据所述丢帧事件提取非语音参数，所述非语音参数包括位置参数和离散
分布参数；
根据所述非语音参数按照预置的语音质量评估模型对每条语句的语音质
量进行评估，得到每条语句的语音质量；
根据所述每条语句的语音质量评估所述语音序列的语音质量。
2.根据权利要求1所述的方法，其特征在于，所述对所述数据包进行解析，
得到解析结果，包括：
对所述数据包的包头进行解析，得到解析结果，所述解析结果包括语音序
列的时长、语音序列的比特数、丢帧位置和语音负载；
所述根据所述解析结果确定所述数据包的帧内容特性，包括：根据所述丢
帧位置在所述数据包中确定当前需要检测的丢失帧部分，分别根据所述语音序
列的时长、语音序列的比特数和语音负载确定所述丢失帧部分的前一个相邻的
未丢失帧的帧内容特性和后一个相邻的未丢失帧的帧内容特性，根据所述前一
个相邻的未丢失帧的帧内容特性、后一个相邻的未丢失帧的帧内容特性和后一
个相邻的未丢失帧的标记确定所述丢失帧部分的帧内容特性。
3.根据权利要求2所述的方法，其特征在于，根据所述语音序列的时长、
语音序列的比特数和语音负载确定未丢失帧的帧内容特性，包括：
获取未丢失帧的实际有效载荷长度；
根据所述语音负载、语音序列的比特数和语音序列的时长确定码率；
若所述码率所对应的标准有效载荷长度与所述实际有效载荷长度一致，则
确定所述未丢失帧为语音帧；
若所述码率所对应的标准有效载荷长度与所述实际有效载荷长度不一致，
则确定所述未丢失帧为静音帧。
4.根据权利要求3所述的方法，其特征在于，所述根据所述前一个相邻的
未丢失帧的帧内容特性、后一个相邻的未丢失帧的帧内容特性和后一个相邻的
未丢失帧的标记确定所述丢失帧部分的帧内容特性，包括：
若确定所述前一个相邻的未丢失帧和后一个相邻的未丢失帧均为静音帧，
或后一个相邻的未丢失帧的标记指示所述后一个相邻的未丢失帧为第一个语
音帧，则确定所述丢失帧部分为静音帧，否则，确定所述丢失帧部分为语音帧。
5.根据权利要求4所述的方法，其特征在于，所述语音帧包括关键语音帧
和非关键语音帧，则在所述确定所述丢失帧部分为语音帧包括：
在确定所述前一个相邻的未丢失帧和后一个相邻的未丢失帧均为语音帧
时，确定所述丢失帧部分为关键语音帧；
在确定所述前一个相邻的未丢失帧为语音帧，以及所述后一个相邻的未丢
失帧为静音帧时，确定所述丢失帧部分的前一半部分为关键语音帧，所述丢失
帧部分的后一半部分为非关键语音帧；
在确定所述前一个相邻的未丢失帧为静音帧，以及所述后一个相邻的未丢
失帧为语音帧时，确定所述丢失帧部分的前一半部分为非关键语音帧，所述丢
失帧部分的后一半部分为关键语音帧。
6.根据权利要求1所述的方法，其特征在于，所述对所述数据包进行解析，
得到解析结果，包括：
对所述数据包的包头进行解析，得到解析结果，所述解析结果包括语音序
列的时长、语音序列的比特数、丢帧位置和语音负载；
根据所述语音负载进行自适应多速率AMR解码，得到AMR解码后语音信
号；
根据所述语音序列的时长和语音序列的比特数计算所述AMR解码后语音
信号中每一帧的帧能量和平均帧能量；
所述根据所述解析结果确定所述数据包的帧内容特性，包括：根据所述丢
帧位置在所述数据包中确定当前需要检测的丢失帧部分，根据计算出的帧能量

\t和平均帧能量确定所述丢失帧部分的前一个相邻的未丢失帧的帧内容特性和
后一个相邻的未丢失帧的帧内容特性，根据所述前一个相邻的未丢失帧的帧内
容特性和后一个相邻的未丢失帧的帧内容特性确定所述丢失帧部分的帧内容
特性。
7.根据权利要求6所述的方法，其特征在于，根据计算出的帧能量和平均
帧能量确定未丢失帧的帧内容特性，包括：
若所述未丢失帧的帧能量小于等于0，则确定所述未丢失帧为静音帧；
若所述未丢失帧的帧能量大于0小于平均帧能量，则确定所述未丢失帧为
非关键语音帧；
若所述未丢失帧的帧能量大于平均帧能量，则确定所述未丢失帧为关键语
音帧。
8.根据权利要求7所述的方法，其特征在于，所述根据所述前一个相邻的
未丢失帧的帧内容特性和后一个相邻的未丢失帧的帧内容特性确定所述丢失
帧部分的帧内容特性，包括：
若确定所述前一个相邻的未丢失帧和后一个相邻的未丢失帧均为静音帧，
则确定所述丢失帧部分为静音帧；
若确定所述前一个相邻的未丢失帧和后一个相邻的未丢失帧均为关键语
音帧，则确定所述丢失帧部分为关键语音帧；
若确定所述前一个相邻的未丢失帧和后一个相邻的未丢失帧均为非关键
语音帧，则确定所述丢失帧部分为非关键语音帧；
若确定所述前一个相邻的未丢失帧为关键语音帧，以及所述后一个相邻的
未丢失帧为静音帧，则确定所述丢失帧部分的前一半部分为关键语音帧，所述
丢失帧部分的后一半部分为非关键语音帧；
若确定所述前一个相邻的未丢失帧为静音帧，以及所述后一个相邻的未丢
失帧为关键语音帧，则确定所述丢失帧部分的前一半部分为非关键语音帧，所
述丢失帧部分的后一半部分为关键语音帧；
若确定所述前一个相邻的未丢失帧为关键语音帧，以及所述后一个相邻的
未丢失帧为非关键语音帧，则确定所述丢失帧部分为关键语音帧；
若确定所述前一个相邻的未丢失帧为非关键语音帧，以及所述后一个相邻
的未丢失帧为关键语音帧，则确定所述丢失帧部分为关键语音帧；
若确定所述前一个相邻的未丢失帧为非关键语音帧，以及所述后一个相邻
的未丢失帧为静音帧，则确定所述丢失帧部分为非关键语音帧；
若确定所述前一个相邻的未丢失帧为静音帧，以及所述后一个相邻的未丢
失帧为非关键语音帧，则确定所述丢失帧部分为非关键语音帧。
9.根据权利要求4、5或8所述的方法，其特征在于，所述根据确定的帧内
容特性对所述语音序列进行语句划分，并将划分得到的语句划分为多个丢帧事
件，包括：
确定静音帧连续出现的帧数超过预置次数时，将所述静音帧之前的语音序
列划分为语句；
确定所述语句中相邻两次丢帧部分的距离小于等于预置距离时，将所述相
邻两次丢帧部分确定为一次丢帧事件；
确定所述语句中相邻两次丢帧部分的距离大于预置距离时，将所述相邻两
次丢帧部分确定为两次丢帧事件。
10.根据权利要求4、5或8所述的方法，其特征在于，所述根据所述非语
音参数按照预置的语音质量评估模型对每条语句的语音质量进行评估，得到每
条语句的语音质量，包括：
根据所述非语音参数按照预置的语音质量评估模型对所述丢帧事件进行
失真映射，得到丢失的语音帧总数；
根据所述丢失的语音帧总数计算语句的语音质量。
11.根据权利要求10所述的方法，其特征在于，所述非语音参数包括非关
键语音帧和关键语音帧之间的距离、语音帧丢帧次数、语音帧一次丢失长度、
以及损伤长度，则所述根据所述非语音参数按照预置的语音质量评估模型对所
述丢帧事件进行失真映射，得到丢失的语音帧总数，包括：
确定连续丢帧时，根据所述非关键语音帧和关键语音帧之间的距离将丢帧
事件中的非关键语音帧映射成丢失的关键语音帧数，根据所述语音帧丢帧次数
确定实际丢失的关键语音帧数，根据所述实际丢失的关键语音帧数和映射得到

\t的丢失的关键语音帧数将所述丢帧事件映射成丢失的语音帧总数；
确定离散丢帧时，根据所述语音帧丢帧次数、语音帧一次丢失长度、以及
损伤长度将丢帧事件中的损伤帧映射成丢失的语音帧数，根据所述语音帧丢帧
次数确定实际丢失的关键语音帧数，根据所述实际丢失的关键语音帧数和映射
得到的丢失的语音帧数将所述丢帧事件映射成丢失的语音帧总数；或者，
确定离散丢帧时，根据所述语音帧一次丢失长度和损伤长度将丢帧事件中
的损伤帧映射成丢失的语音帧数，根据所述语音帧丢帧次数确定实际丢失的关
键语音帧数，根据所述实际丢失的关键语音帧数和映射得到的丢失的语音帧数
将所述丢帧事件映射成丢失的语音帧总数。
12.根据权利要求10所述的方法，其特征在于，所述非语音参数包括非关
键语音帧和关键语音帧之间的距离、语音帧丢帧次数、平均丢失长度和平均损
伤长度，则所述根据所述非语音参数将所述丢帧事件中不同位置下的丢失帧和
不同离散分布下的丢失帧映射成丢失的语音帧总数，包括：
确定连续丢帧时，根据所述非关键语音帧和关键语音帧之间的距离将丢帧
事件中的非关键语音帧映射成丢失的关键语音帧数，根据所述语音帧丢帧次数
确定实际丢失的关键语音帧数，根据所述实际丢失的关...

【专利技术属性】
技术研发人员：杨付正，李学敏，江亮亮，肖玮，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人