数字音频变速处理方法及其设备技术

技术编号：6990685 阅读：393 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及音频信号处理技术，公开了一种数字音频变速处理方法及其设备。本发明专利技术中，使用具有幅度衰减、增加特性的一对完美重构窗函数WL和WR，按不同的时延作用于原始数字音频获得一对加窗数据，利用加窗数据重构音频波形，获得变速处理后的音频。由于不需要对音频的基音周期和相关性进行检测，也不需要进行时频变换，因此计算量极低。而且，利用了音频信号自身波形的压缩和引入来实现播放内容的时间增减，不对音频波形本身做改动，因此能更多地保持原有音质。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及音频信号处理技术，特别涉及音频信号处理技术中的音频变速处理。
技术介绍
在各种多媒体应用中，录制好的数字音频的重放速度调整具有广泛的需求。比如降低语音重放的音速，可以有助于有听力或理解力障碍的人群以及外语初学者提高听音的可懂度；而提高音速，则可帮助听者节省从录音中获取信息的时间。此外，对音乐重放音速的调整还可以改变音乐的节奏，获得独特的效果；对于视频中的伴音，音频重放的音速调整，可以使得视频在加快或放慢回放速度的同时，使观众可以听到同步的，没有发生畸变的伴音。但是，直接对音频进行播放速度调整而不做任何处理，会因为声音中频率成分的线性迁徙而带来音调和音色的变化。比如说，在降低音速时，声音会变低沉，语音则变现为如沉睡中发出的鼻音；在提高音速时，声音会变得尖锐，语音则表现为如幼童快速讲话。因此，为了保证音频仅仅发生了音速变化，而音调和音色均不发生变换，没有明显畸变，需要对数字音频进行处理。目前，大都采用基于重叠相加技术的算法或者基于时频变换和频谱处理的算法进行音频的变速处理。关于音频变速处理的技术也可参见专利号为“5952596” 的美国专利。然而，本专利技术的专利技术人发现，在基于重叠相加(overlap add)技术实现的算法中，需要通过检测波形的相似程度(waveform similarity)来确定重叠窗的时延，这类方法只能处理具有明显基音周期的语音，它使用时域或频域的互相关检测技术取得相似波形的时延，以此作为重叠窗的时延，因此计算消耗较大且处理音质一般；而基于时频变换和频谱处理的算法可以处理包括语音和音乐的...

【技术保护点】
１．一种数字音频变速处理方法，其特征在于，包含以下步骤：Ａ将待进行音频变速处理的音频信号数据填充到缓冲区，直至所述缓冲区的已填充长度达到数据处理长度Ｌｐ；Ｂ将所述缓冲区中待处理的音频信号数据通过以下方式进行加窗处理，得到输出信号ｘｏｕｔ：如果所述音频变速处理为加快速度的处理，则将所述缓冲区中长度为Ｌｐ的音频信号数据与长度为ＬＷ的窗函数ＷＬ左端对齐后逐点乘上ＷＬ得到ｘＬ，将所述缓冲区中长度为Ｌｐ的音频信号数据与长度为ＬＷ的窗函数ＷＲ右端对齐后逐点乘上ＷＲ得到ｘＲ，将得到的ｘＬ和ｘＲ相加，得到ＬＷ个所述输出信号ｘｏｕｔ；如果所述音频变速处理为放慢速度的处理，则将所述缓冲区中长度为Ｌｐ的音频信号数据与长度为ＬＷ的窗函数ＷＬ右端对齐后逐点乘上ＷＬ得到ｘＬ，将所述缓冲区中长度为Ｌｐ的音频信号数据与长度为ＬＷ的窗函数ＷＲ左端对齐后逐点乘上ＷＲ得到ｘＲ，将得到的ｘＬ和ｘＲ相加，得到ＬＷ个所述输出信号ｘｏｕｔ；Ｃ将已完成加窗处理的ＬＤ个信号移出缓冲区，在缓冲区尾部继续填充待处理的音频信号数据，直至所述缓冲区的已填充长度达到数据处理长度Ｌｐ；重复执行所述步骤Ｂ和步骤Ｃ，直至完成所有的音频信号数据的音频变...

【技术特征摘要】

【专利技术属性】
技术研发人员：吴晟，林福辉，张本好，董树景，李昙，徐晶明，
申请(专利权)人：展讯通信上海有限公司，
类型：发明
国别省市：31

全部详细技术资料下载我是这个专利的主人