数字音频变速处理方法及其设备技术

技术编号:6990685 阅读:393 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及音频信号处理技术,公开了一种数字音频变速处理方法及其设备。本发明专利技术中,使用具有幅度衰减、增加特性的一对完美重构窗函数WL和WR,按不同的时延作用于原始数字音频获得一对加窗数据,利用加窗数据重构音频波形,获得变速处理后的音频。由于不需要对音频的基音周期和相关性进行检测,也不需要进行时频变换,因此计算量极低。而且,利用了音频信号自身波形的压缩和引入来实现播放内容的时间增减,不对音频波形本身做改动,因此能更多地保持原有音质。

【技术实现步骤摘要】

本专利技术涉及音频信号处理技术,特别涉及音频信号处理技术中的音频变速处理。
技术介绍
在各种多媒体应用中,录制好的数字音频的重放速度调整具有广泛的需求。比如 降低语音重放的音速,可以有助于有听力或理解力障碍的人群以及外语初学者提高听音的 可懂度;而提高音速,则可帮助听者节省从录音中获取信息的时间。此外,对音乐重放音速 的调整还可以改变音乐的节奏,获得独特的效果;对于视频中的伴音,音频重放的音速调 整,可以使得视频在加快或放慢回放速度的同时,使观众可以听到同步的,没有发生畸变的 伴音。但是,直接对音频进行播放速度调整而不做任何处理,会因为声音中频率成分的 线性迁徙而带来音调和音色的变化。比如说,在降低音速时,声音会变低沉,语音则变现为 如沉睡中发出的鼻音;在提高音速时,声音会变得尖锐,语音则表现为如幼童快速讲话。因 此,为了保证音频仅仅发生了音速变化,而音调和音色均不发生变换,没有明显畸变,需要 对数字音频进行处理。目前,大都采用基于重叠相加技术的算法或者基于时频变换和频谱 处理的算法进行音频的变速处理。关于音频变速处理的技术也可参见专利号为“5952596” 的美国专利。然而,本专利技术的专利技术人发现,在基于重叠相加(overlap add)技术实现的算法中, 需要通过检测波形的相似程度(waveform similarity)来确定重叠窗的时延,这类方法只 能处理具有明显基音周期的语音,它使用时域或频域的互相关检测技术取得相似波形的时 延,以此作为重叠窗的时延,因此计算消耗较大且处理音质一般;而基于时频变换和频谱处 理的算法可以处理包括语音和音乐的通用音频(general audio),它对原始数字音频进行 重采样以变换采样率,然后将改变了采样率的数字音频转换到频域获得音频的频谱,随后 对频谱进行频谱搬移(frequency shift),将处理后的频谱变换回时域,这个算法一般使用 可完美重构的短时傅里叶变换(short time Fourier transform)实现,为能获得较高的处 理音质,短时傅里叶变换需要一次处理较长的音频,这类方法虽然能获得比较好的处理音 质,但是它的计算量和存储量较大,在手持和移动设备上,因为计算能力和功耗的约束,该 算法几乎无法实现。
技术实现思路
本专利技术的目的在于提供一种数字音频变速处理方法及其设备,对通用数字音频的 变速处理可以以更低的计算量实现,并且得到较高的处理音质。为解决上述技术问题,本专利技术的实施方式提供了一种数字音频变速处理方法,包 含以下步骤A将待进行音频变速处理的音频信号数据填充到缓冲区,直至所述缓冲区的已填 充长度达到数据处理长度Lp ;B将所述缓冲区中待处理的音频信号数据通过以下方式进行加窗处理,得到输出信号Xout 如果所述音频变速处理为加快速度的处理,则将所述缓冲区中长度为Lp的音频信 号数据与长度为Lw的窗函数I左端对齐后逐点乘上I得到&,将所述缓冲区中长度为Lp 的音频信号数据与长度为Lw的窗函数Wk右端对齐后逐点乘上Wk得到&,将得到的^和& 相加,得到Lw个所述输出信号x。ut ;如果所述音频变速处理为放慢速度的处理,则将所述缓冲区中长度为Lp的音频信 号数据与长度为Lw的窗函数I右端对齐后逐点乘上I得到^,将所述缓冲区中长度为Lp 的音频信号数据与长度为Lw的窗函数Wk左端对齐后逐点乘上Wk得到&,将得到的^和& 相加,得到Lw个所述输出信号x。ut ;C将已完成加窗处理的Ld个信号移出缓冲区,在缓冲区尾部继续填充待处理的音 频信号数据,直至所述缓冲区的已填充长度达到数据处理长度Lp ;重复执行所述步骤B和步骤C,直至完成所有的音频信号数据的音频变速处理;其中,所述I为具有幅度衰减特性的窗函数,所述Wk为具有幅度增加特性的窗函 数,Wk各有Lw个点的数据,所对应的点相加等于1或近似于1。本专利技术的实施方式还提供了一种数字音频变速处理设备,包含填充模块,用于将待进行音频变速处理的音频信号数据填充到缓冲区,直至所述 缓冲区的已填充长度达到数据处理长度Lp ;加窗处理模块,用于将所述缓冲区中待处理的音频信号数据进行加窗处理,得到 输出信号x。ut ;所述加窗处理模块在所述音频变速处理为加快速度的处理时,将所述缓冲区 中长度为Lp的音频信号数据与长度为Lw的窗函数\左端对齐后逐点乘上\得到&,将所 述缓冲区中长度为Lp的音频信号数据与长度为Lw的窗函数^右端对齐后逐点乘上Wk得到 Xr,将得到的^和&相加,得到Lw个所述输出信号X。ut ;在所述音频变速处理为放慢速度的 处理时,将所述缓冲区中长度为Lp的音频信号数据与长度为Lff的窗函数I右端对齐后逐 点乘上I得到^,将所述缓冲区中长度为Lp的音频信号数据与长度为Lw的窗函数Wk左端 对齐后逐点乘上Wk得到χκ,将得到的&和&相加,得到Lw个所述输出信号x。ut ;移位模块,用于将已完成加窗处理的Ld个信号移出缓冲区,并指示所述填充模块 在缓冲区尾部继续填充待处理的音频信号数据,直至所述缓冲区的已填充长度达到数据处 理长度Lp ;当所述缓冲区的已填充长度达到数据处理长度Lp时,触发所述加窗处理模块的处 理;当所述加窗处理模块得到Lw个所述输出信号x。ut时,触发所述移位模块的处理,直至完 成所有的音频信号数据的音频变速处理;其中,所述I为具有幅度衰减特性的窗函数,所述Wk为具有幅度增加特性的窗函 数,Wk各有Lw个点的数据,所对应的点相加等于1或近似于1。本专利技术实施方式与现有技术相比,主要区别及其效果在于使用具有幅度衰减、增加特性的一对完美重构窗函数I和Wk,按不同的时延作用 于原始数字音频获得一对加窗数据,利用加窗数据重构音频波形,获得变速处理后的音频。 由于不需要对音频的基音周期和相关性进行检测,也不需要进行时频变换,因此计算量极 低。而且,由于利用了音频信号自身波形的压缩和引入来实现播放内容的时间增减,不对音频波形本身做改动,因此能更多地保持原有音质。进一步地,在对缓冲区中待处理的音频信号数据进行加窗处理时,W^和Wk为所对 应的点相加等于1的初始重构窗函数;或者,W^和Wk为根据音频信号数据的回声类型所选 择的不同权值分布的重构窗函数;不同权值分布的重构窗函数分别单独生成,或者通过对 初始重构窗的变换得到。由于音频压缩(加快速度)是将时间被压缩掉的音频信息平滑 地分散在处理后的缩短的音频数据上;而音频扩展(放慢速度)则是通过引入过去和未来 (相对参照数据时间上较新)的音频信息进行平滑地交迭,获得更长的音频数据。这种交迭 的过程都会把能量较大的信号引入或扩散到原来能量很小的部分,造成过回声(回声在信 号发生后)和预回声(回声在信号发生前),因此在进行加窗处理时,可以进一步地根据回 声类型所选择适合的重构窗函数,以进一步保证变速后的音频质量。进一步地,音频信号数据的回声类型根据音频信号数据的块能量或块绝对值与预 设门限的判断结果获取。由于如果过去的信号大于现在的信号,容易发生过回声;如果过去 的信号小于现在的信号,容易发生预回声。因此以音频信号的块能量(或块绝对值)作为 回声类型判断的依据,可有效保证判断结果的准本文档来自技高网
...

【技术保护点】
1.一种数字音频变速处理方法,其特征在于,包含以下步骤:A将待进行音频变速处理的音频信号数据填充到缓冲区,直至所述缓冲区的已填充长度达到数据处理长度Lp;B将所述缓冲区中待处理的音频信号数据通过以下方式进行加窗处理,得到输出信号xout:如果所述音频变速处理为加快速度的处理,则将所述缓冲区中长度为Lp的音频信号数据与长度为LW的窗函数WL左端对齐后逐点乘上WL得到xL,将所述缓冲区中长度为Lp的音频信号数据与长度为LW的窗函数WR右端对齐后逐点乘上WR得到xR,将得到的xL和xR相加,得到LW个所述输出信号xout;如果所述音频变速处理为放慢速度的处理,则将所述缓冲区中长度为Lp的音频信号数据与长度为LW的窗函数WL右端对齐后逐点乘上WL得到xL,将所述缓冲区中长度为Lp的音频信号数据与长度为LW的窗函数WR左端对齐后逐点乘上WR得到xR,将得到的xL和xR相加,得到LW个所述输出信号xout;C将已完成加窗处理的LD个信号移出缓冲区,在缓冲区尾部继续填充待处理的音频信号数据,直至所述缓冲区的已填充长度达到数据处理长度Lp;重复执行所述步骤B和步骤C,直至完成所有的音频信号数据的音频变速处理;其中,所述WL为具有幅度衰减特性的窗函数,所述WR为具有幅度增加特性的窗函数,WL和WR各有LW个点的数据,所对应的点相加等于1或近似于1。...

【技术特征摘要】

【专利技术属性】
技术研发人员:吴晟林福辉张本好董树景李昙徐晶明
申请(专利权)人:展讯通信上海有限公司
类型:发明
国别省市:31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1