一种基于非线性参数拟合的低码率音频质量客观评价方法技术

技术编号:7431686 阅读:256 留言:0更新日期:2012-06-14 20:55
本发明专利技术公开了一种用于低码率音频质量客观评价的方法,属于通信领域。该方法的特点在于首先选出一些具有典型特征的音频,进行不同码率的压缩,并对压缩再解压后的音频进行主观评价打分;然后提取出每种码率下的每段音频的码率和尺度因子,在每种码率下独立进行主观评价分数和尺度因子的非线性参数拟合,得到每种码率下各自的拟合公式;从需要进行客观评价的音频流中提取出码率和尺度因子,根据码率选用对应的公式,并把尺度因子代入该公式,计算得到该音频的客观评价分数。其中每种码率下独立的参数拟合,能够消除不同的码率造成的影响,更准确地度量量化造成的质量损伤。对主观评价分数和尺度因子进行非线性参数拟合,能够模拟尺度因子较小或较大时分数较高,而尺度因子居中时分数较低的现象,提高了拟合度,使客观评价较好地模拟主观评价。

【技术实现步骤摘要】

本专利技术涉及音频质量客观评价的一种方法,属于通信领域。
技术介绍
随着多媒体技术的发展,数字压缩音频被广泛应用于网络、广播、影视和移动多媒体通信等领域。但是,音频压缩是有损压缩,压缩会造成音频质量的下降。为了保障提供给用户较好的音频质量,有必要对压缩后的音频进行质量评价。音频质量的评价方法包括主观评价方法和客观评价方法。主观评价的结果与人耳的实际感受一致。但是,主观评价需要较大的开销,费时、 费力;主观评价受听音者的生理和心理状况、听音环境等条件影响比较大;主观评价不能用于广播电视等业务的音频质量的实时监控。因此,有必要研究音频质量的客观评价方法。ITU-R BS. 1387标准(简称为PEAQ)是迄今为止唯一的音频质量客观评价国际标准。PEAQ是一个全参考的音频质量评价方法,需要参考原始音频进行音频质量客观评价,实际应用时很难获得原始音频;PEAQ适用于高码率的音频质量客观评价,低码率压缩音频中的损伤与高码率压缩时有所不同;PEAQ运算复杂度较高,不适合应用到对实时性要求较高的场合。徐晓娜提出一种压缩域音频质量客观评价方法。从压缩后的音频流中提取出码率和尺度因子,并采用PEAQ方法对这些音频进行客观评分,用这些音频的PEAQ评分对码率和尺度因子进行线性拟合,得到音频的评分与码率、尺度因子之间的线性拟合公式。对需要进行客观评价的音频进行评分时,提取出该音频的码率和尺度因子,代入上述公式,计算得到客观评价分数。本专利技术用主观评价的结果拟合从音频码流中提取出的特征参数-码率和尺度因子,并且每种码率下单独进行非线性参数拟合。每种码率下独立进行参数拟合,可以消除码率的影响,更准确地度量尺度因子对音频质量的影响。非线性参数拟合能够有效地拟合实际情况尺度因子较大或较小时,音频得分高;尺度因子居中时,音频得分低。
技术实现思路
为了对低码率压缩后的音频进行无参考客观评价,本专利技术提出了。为实现上述的专利技术目的,本专利技术采用下述的技术方法1.音频质量主观评价方法选取一些具有典型特征的音频,对选中的每段音频分别进行161cbpS、241ApS和 32kbps码率的压缩,并对压缩再解压后的每段音频进行主观评价,得到每段音频的主观评价分数。2.压缩域音频质量特征参数提取方法从压缩后的音频流中提取出能够表征音频质量的特征参数码率和尺度因子。通常情况下,压缩后的码率越高,则压缩带来的音频损伤越小,音频质量则越好。但是,即使码率相同,不同的音频素材压缩后的质量并不相同。因此,有必要进一步提取能反映这种质量差别的特征参数。尺度因子反映了音频被压缩时的量化等级,而量化是造成压缩音频质量损伤的原因。本方法从压缩后的音频中提取尺度因子来度量音频质量的损伤程度。3.每种码率下独立的非线性参数拟合方法在三种码率(161ibpS、241ibpS和321ibps)下,分别用从压缩后的音频流中提取出的尺度因子来拟合这些音频的主观评价分数,得到三种码率下各自的非线性拟合公式。每种码率下独立进行拟合,能够消除不同的码率造成的影响,更准确地度量量化造成的质量损伤。尺度因子与主观评价分数的拟合,采用非线性参数拟合。原因如下尺度因子较小或较大时主观评价分数较高,而尺度因子居中时主观评价分数较低。在同一种码率下,尺度因子较小时,量化步长小,因此压缩带来的失真也小,主观评价分数高;尺度因子大时,压缩带来的失真也大,但是因为尺度因子大的这些音频包含了更丰富的频率成分,即使这时失真较大,人耳也分辨不出这些失真。4.压缩域音频质量客观评价方法从需要进行客观评价打分的音频流中提取出码率和尺度因子。根据码率,选用对应的非线性参数拟合公式;把尺度因子代入该公式,计算得到该音频的客观评价分数。本专利技术实施例提供的技术方案的有益效果是1.在每种码率下独立进行尺度因子与主观评价分数的非线性拟合,拟合准确度尚ο2.本方法属于无参考音频质量客观评价方法,不需要参考原始音频,能够应用于不能获取原始音频的场合。3.本方法计算复杂度低,可以实时运算,实现对音频质量的实时监控。 附图说明图1为采用基于非线性参数拟合的音频质量客观评价方法对压缩后的音频进行实时评价的示意2为本专利技术的框架3为非线性参数拟合的流程4为对音频进行客观评价的流程图具体实施例方式为使本专利技术的目的、技术方案和优点更加清楚,下面结合图对本专利技术做进一步描述。图3和图4所示为本专利技术的流程图。具体流程如下描述。步骤1.选取10段音频压缩再解压并主观评价打分,用来在步骤3中进行非线性参数拟合,以得到拟合系数。每段音频的长度在10秒到20秒之间,音频素材的类型包括男声、女声、响板、钢琴、交响乐和电影配乐等。分别进行161ibpS、241ibpS和321ibps码率的压缩,并对压缩再解压后的每段音频进行主观评价,得到压缩后音频的主观评价分数。步骤2.从压缩后的每段音频流中提取出音频质量特征参数码率和尺度因子。步骤3.在每种码率下分别进行主观评价分数和尺度因子的二阶非线性参数拟合,得到各自的非线性拟合公式。步骤4.从需要进行客观评价打分的音频流中提取出码率和尺度因子。步骤5.根据码率,选用对应的非线性公式。步骤6.把尺度因子代入公式,计算得到该音频的客观评价分数。上面对本专利技术所述的进行了详细的说明,但本专利技术的具体实现形式并不局限于此。以上所述仅为本专利技术的较佳实施例,并不用以限制本专利技术,凡在本专利技术的精神和原则之内,所作的任何修改、等同替换、 改进等,均应包含在本专利技术的保护范围之内。权利要求1.,其特征在于首先选出一些具有典型特征的音频,进行不同码率的压缩,并对压缩再解压后的音频,进行主观评价打分;然后提取出每种码率下的每段音频的码率和尺度因子,在每种码率下独立进行主观评价分数和尺度因子的非线性参数拟合,得到每种码率下各自的拟合公式;从需要进行客观评价的音频流中提取出码率和尺度因子,根据码率选用相应的公式,并把尺度因子代入该公式,计算得到该音频的客观评价分数。2.如权利要求1所述的每种码率下独立的参数拟合方法,其特征在于,在每种码率下独立进行主观评价分数和尺度因子的拟合,能够消除不同的码率造成的影响,更准确地度量量化造成的质量损伤。3.如权利要求1所述的基于非线性参数拟合的方法,其特征在于,对主观评价分数和尺度因子进行非线性参数拟合,以使拟合曲线能够实现尺度因子较小或较大时分数较高, 而尺度因子居中时分数较低。全文摘要本专利技术公开了一种用于低码率音频质量客观评价的方法,属于通信领域。该方法的特点在于首先选出一些具有典型特征的音频,进行不同码率的压缩,并对压缩再解压后的音频进行主观评价打分;然后提取出每种码率下的每段音频的码率和尺度因子,在每种码率下独立进行主观评价分数和尺度因子的非线性参数拟合,得到每种码率下各自的拟合公式;从需要进行客观评价的音频流中提取出码率和尺度因子,根据码率选用对应的公式,并把尺度因子代入该公式,计算得到该音频的客观评价分数。其中每种码率下独立的参数拟合,能够消除不同的码率造成的影响,更准确地度量量化造成的质量损伤。对主观评价分数和尺度因子进行非线性参数拟合,能够模拟尺度因子较小或较大时分数较高,而尺度因子居中时分数较低的现象,提高了拟合度,使客观评价较好地模拟主观评价。文档编号G10L19/14GK10249637本文档来自技高网
...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:赵艳明姜秀华胡泽
申请(专利权)人:中国传媒大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术