当前位置: 首页 > 专利查询>清华大学专利>正文

一种使用正弦模型进行音频错误隐藏处理的方法技术

技术编号:3420216 阅读:195 留言:0更新日期:2012-04-11 18:40
一种使用正弦模型进行音频错误隐藏处理的方法,属于网络及通信领域。按如下步骤进行操作:一,整个系统的重建按照前一帧和当前帧的错误分为并列的4种情况,A.前帧和当前帧都没错,正确解码返回;B.前帧无误当前帧错误,对时域模型进行分析综合,把综合帧的奇对称部分和残留的偶对称部分相加作重建帧;C.前帧错误当前帧无误,把模型分析得到的综合帧的偶对称部分和残留奇对称部分相加作重建帧;D.前帧和当前帧都错,简单策略处理当前帧;二,输出上面得到的解码结果或错误隐藏的时域重建。该方法适合于各种丢帧率下的处理,对于中低丢帧率,连续帧丢失的概率较小,而对于中高丢帧率,使用简单的丢帧策略,不会造成更大的听觉失真。

【技术实现步骤摘要】

本专利技术属于网络及通信领域,特别涉及到一种使用正弦模型进行 音频错误隐藏处理的方法。
技术介绍
随着有线和无线网络的迅速发展,用户通过因特网对音频服务的 需求越来越广泛,包括视频会议、在线音乐点播、IP电话等。然而虽 然有信道编解码来实现纠错和检错,但是还是不能保证因特网音频通信提供有质量的服务(QoS),在网络通信,尤其是无线网络通信中, 由于多径衰落、噪声干扰及网络拥塞等原因,经常造成数字音频压縮 数据包丢失或压缩数据的错误。由于压縮音频数据对突发错误,特别 是压縮数据的帧头信息错误或丢失,非常敏感,会造成压縮数据的解 码失败,从而在没有引入音频错误隐藏模块时导致接收端音频质量恶 化。关于音频错误隐藏,音频错误隐藏的定义有广义和狭义两种,狭 义的错误隐藏实际上就是针对解码器进行的,针对解码中出现的错误 对音频序列进行重建再生,而广义的音频错误隐藏还包括在编码端就 加入一定的冗余信息,以利于解码端的重建。 一般所说的错误隐藏就 是狭义的错误隐藏,可以看出跟传统的前向纠错和自动反馈重发等纠 错算法不同,狭义的错误隐藏不占用额外带宽,只利用接收端接收到 的信号提供的残留信息,有更高的信道带宽利用率。信道前向纠错编码是一种针对信道传输中可能出现的错误的处 理,不用关心信源的内容,只是在信源传输时,加上信道的冗余信息 以便解码端进行检错或者纠错。与信道前向纠错编码不同,针对信源 处理的音频信号重建一般是基于时域的音频解码器输出出现的问题, 如click、高频噪声等时域干扰,使用一种错误消除方案去除它们。 而音频的错误隐藏则包括范围更广,可以是时域的处理,可以是在解 码器解码过程中,利用频域、变换域的信息进行错误重建,还可以利用发端的附加数据作为指导对信号进行重建。而且错误隐藏一般是针 对网络应用中可能出现的丢包情况,即出现整个音频帧丢失,重建丢 失帧的替代,让人耳的主观听觉效果更好,降低音质损坏程度。音频 错误隐藏与纠错编码和信号重建的关系在音频通信系统中如图1所 示。对于录音媒体,如光盘等,因损伤等原因,往往对波形文件产生 一定的局部干扰,如咔嚓噪声click的存在,这样在播放时,没有任 何处理的话,就能听到如蜂鸣、尖刺等失真,影响人的听音质量。因 而迫切需要一些针对音频数据的错误进行有效处理和方法。基于变换的编解码系统,为了解决变换块间经过编解码系统产生 的块效应, 一般都采用相邻的编码帧存在重叠相加,这种思路让现在 的基于变换的编解码系统采用一种重叠相加的时频变换方法,比较有代表性的是MPEG的音频编解码系统中采用的修正余弦变换(即 Modified Discrete Cosine Transform,縮写MDCT)和ITU G.722.1 中采用的重叠调制变换(即Modulated Lapped Transform,縮写MLT)。基于变换的编解码系统使用的重叠相加策略使得一帧的编码序列 的产生或者解码序列的重建都是通过前后两帧的编码序列或者界面 序列得到的。以MPEG感知音频编解码算法中常用的50%重叠相加 的MDCT时频变换为例,根据MDCT的特性,若将等长的2个序 列^Wxj顺序叠加得到后进行MDCT变换,然后再对变换结果进行IMDCT变换,那么输出的结果是 /M)Cr(M"CT()) = - x,}, {x2 +《}] 其中x,'表示序列x的逆序排列,如果两次进行MDCT变换的数 据有50 %的重叠,那么最终重叠的A被恢复出来了。这种重叠相加的特性让一帧序列的编码码流在前后两个编码帧中, 一帧序列的完全 解码也需要前后两个编码帧的解码结果做重叠相加,同时如果发生一 帧序列的丢失情况下,也会导致连续两帧序列的丢失,其错误模型如 图2所示。正弓玄分析禾口综合(Sinusoidal analysis and synthesis,縮写的SAS)首先对信号加窗,然后对固定的片断的信号进行分析,把信号 表示为一组正弦信号的叠加,这些正弦信号的参数就是幅度、频率和 相位。如果把分析得到的正弦模型的所有的幅度、频率和相位都用于综合模型,则重建的音质可以达到接近透明音质。随着Internet网络和第三代、超三代移动通信的不断完善与发展, 通信带宽不断拓展,影音多媒体服务越来越丰富,交互式在线服务对 数据传输实时性要求高,传统的纠错模式占据了大量带宽并造成了较 大的时延,难以满足高度实时性要求,服务的高质量高实时性要求在 尽可能少地占据带宽、尽可能少地增加时延条件下实现高品质的影音 通信,能够同时满足这些要求的错误隐藏技术成为人们关注的热点。 音频错误隐藏具有广泛的应用范围,网络会议、IP电话、移动通信、 在线点播、数字广播及唱盘的纠错。视频会议和远程教学等网络流媒体服务要求确保音、视频媒体流 的实时传输,目前网络上传输音、视频数据普遍采用的是基于UDP (用户数据报协议)的RTP (实时传输协议)。UDP协议可以更充分地 利用带宽传输数据,获得更好的使用效果,但是该协议本身没有重传 机制,会因为网络的阻塞或传输的延迟导致接收端数据包丢失,影响 音、视频质量,因此需要采用错误隐藏技术来掩饰丢失造成的错误, 提高媒体输出质量。20世纪90年代,错误隐藏方法作为GSM系统的非强制的建议 在ETSI中被提出,用于改善蜂窝移动通信系统的语音质量,并且在 第三代移动通信的宽带语音编码AMR-WB +中又采用了相应的错误 隐藏方案来隐藏误码或丢失对语音质量造成的影响。
技术实现思路
本专利技术需要解决的技术问题是,由于随着网络及通信的快速发 展,传统的纠错模式因其占据大量带宽,造成较大的延时已经不能满 足高度实时性要求,为了克服现有技术中的这些不足,实现高品质的 影、音通信,就要创新的提出一种新的处理方法,本专利技术的目的是一 种使用正弦模型进行音频错误隐藏处理的方法,该方法利用了基于重 叠相加的编解码系统的特性,首先对既定的模型进行分析,然后提取 分析模型的参数做适当处理,最后综合得到一个音频重建帧,提取该 重建帧的适当部分和残留部分相加,就可以得到重建的序列。完成本专利技术的目的采用的具体技术方案如下 一种使用正弦模型 进行音频错误隐藏处理的方法,其特征在于,按如下步骤进行操作(一) 首先,把整个系统的重建按照前一帧和当前帧的错误分为并列的4种情况,A.前帧和当前帧都没有错误,正确解码返回;B.前帧无误, 当前帧错误,则对时域模型进行分析综合,得到综合帧,把综合帧的 奇对称部分和残留的偶对称部分相加作为重建帧;C.前帧错误,当前 帧无误,则把模型分析得到的综合帧的偶对称部分和残留奇对称部分 相加作为重建帧;D.前帧和当前帧都错误,则简单策略处理当前帧;(二) .然后,输出上面得到的正确解码结果或者错误隐藏的时域重 建。本专利技术所述的按照前一帧和当前帧的错误分为并列的4种情况详细地阐述如下(A) 、前帧和当前帧都没有错误这种情况下,两帧都正确解码,此时没有错误,直接输出解码结 果即可。(B) 前一帧无误、当前帧错误该帧的重建过程分为两部分,即首先通过对时域模型分析,通过 对频谱的峰值计算、频谱峰点相邻补偿、相位补偿以及能量补偿等步 骤得到频域的重建,经过IFFT,即可以得到重建的时域信号,然后 为了相邻帧间的时域连续性,取重建本文档来自技高网
...

【技术保护点】
一种使用正弦模型进行音频错误隐藏处理的方法,其特征在于,按如下步骤进行操作:(一)首先,把整个系统的重建按照前一帧和当前帧的错误分为并列的4种情况,A.前帧和当前帧都没有错误,正确解码返回;B.前帧无误,当前帧错误,则用正弦模型对时域信号进行分析综合,得到综合帧,把综合帧的奇对称部分和残留的偶对称部分相加作为重建帧;C.前帧错误,当前帧无误,则可以用正弦模型对时域信号进行分析综合,再综合帧的偶对称部分和残留奇对称部分相加作为重建帧;D.前帧和当前帧都错误,则简单策略处理当前帧;(二).然后,输出上面得到的正确解码结果或者错误隐藏的时域重建。

【技术特征摘要】

【专利技术属性】
技术研发人员:侯欢窦维蓓
申请(专利权)人:清华大学
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1