变速不变调的声音播放方法及装置制造方法及图纸

技术编号:3908211 阅读:262 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种变速不变调的声音播放方法及装置。此方法是先取得切分为多个小段的音频数据,其中各个小段包括多个频率分量,接着计算每一个小段中所有频率分量的能量与其前一个小段中对应频率分量的能量的差值总和,然后根据播放速度及各个小段的差值总和,动态调整所播放的音频数据的小段,以播放音频数据。

【技术实现步骤摘要】

本专利技术是有关于一种声音播放方法及装置,且特别是有关于一种变速不变调的声 音播放方法及装置。
技术介绍
随着科技的进步,人们不断地研究声音的压缩方法,以求能够提供更好的声音品 质与相关应用。在语音方面,由于数字多媒体技术的发展,语音信号处理已成为消费电子与 通讯产品中最重要且广泛应用的技术,因此不论在市场商机上或是在技术应用上都受到产 业界高度的重视。在音讯方面,随着MP3随身听风潮的引领之下,数字音讯产品不仅创造了 庞大的市场商机,且已逐渐成为民众生活上倚赖的基本需求。此外,由于视讯处理的应用往 往会伴随着音讯处理,而音讯处理本身又可独立应用,因此音讯处理技术的应用已不只限 于音讯本身,而涵盖多媒体的大部分领域。由上述可知,数字音讯技术的重要性已不可同日 而语。以电视节目的播放为例,一般用户在使用电视机或机顶盒的个人录像机 (Personal Video Recorder,PVR)功能时,经常需要快速搜索节目的内容。其中,若使用时 间平移(Time-Shift)的功能时,则在使用后通常需要执行快速播放以追上当前直播的节 目;若要回放精采画面时,则可能需要慢速播放以看清楚关键画面。然而,在改变声音播放 速度的同时,连带地也会改变了声音的声调,此时就必需利用变速不变调技术,让使用者在 这些情况下还能够听清楚节目内容。目前业界使用的变速不变调技术主要有三大类第一类是频域谱线法,其是保留 声音的每一段谱线中的重要频率,而适用于语音学习机;第二类是能量选择法,其是比较声 音中各个小段的能量,并除去其中能量较小的部分,而保留能量较大的部分,故在使用于长 时间语音录制时,可让使用者快速搜寻想听的部分;第三类是基本周期法,其是搜寻声音的 基本周期,并通过重复或者删减基本周期以拉长或者缩短声音,适用于音乐合成。然而,频域谱线法仅适用于慢速播放,在快速播放时则会听不清楚;能量选择法会 在声音能量变化不大时失去作用;基本周期法则会在声音内容丰富时找不到基本周期。因 此,有必要提供一种能够同时适用于各种内容的声音与多种播放速度的播放技术,以弥补 既有技术的不足。
技术实现思路
本专利技术提供一种变速不变调的声音播放方法,根据音频数据中各个小段与前一小 段之间的差异来决定所播放的小段内容,可最大程度地保留声音的变化部分。本专利技术提供一种变速不变调的声音播放装置,根据播放速度动态调整所播放音频 数据,可在快速或慢速播放时提供清楚的声音。本专利技术提出一种变速不变调的声音播放方法,其包括先取得切分为多个小段的音 频数据,其中各个小段包括多个频率分量,且各个频率分量具有一能量,接着计算每一个小段中所有频率分量的能量与其前一个小段中对应频率分量的能量的差值总和,然后根据播 放速度及各个小段的差值总和,将所播放的音频数据的部分小段扔掉或重复,以播放音频 数据。在本专利技术的一实施例中,上述取得切分为多个小段的音频数据的步骤包括接收一 音频数据,将此音频数据切分为多个小段,并分别计算各个小段中多个频率分量的能量。在本专利技术的一实施例中,上述分别计算各个小段中多个频率分量的能量的步骤包 括将各个小段区分为多个快速傅利叶转换(Fast Fourier Transform,FFT)频点,并计算各 个FFT频点的能量值以作为各个频率分量的能量。在本专利技术的一实施例中,上述分别计算各个小段中多个频率分量的能量的步骤包 括将各个小段区分为滤波器组(Filter Bank)的多个子带(Sub-band),并计算各个子带的 能量值以作为各个频率分量的能量。在本专利技术的一实施例中,上述取得切分为多个小段的音频数据的步骤包括接收一 压缩音频数据,将此压缩音频数据解压缩,以取得切分成多个小段的音频数据以及各个小 段的所有频率分量的能量。在本专利技术的一实施例中,上述计算每一个小段中所有频率分量的能量与其前一个 小段中对应频率分量的能量的差值总和的步骤包括先分别计算每一个小段中各个频率分 量的能量与其前一个小段中对应频率分量的能量的差值,然后再将每一个小段中所有频率 分量对应的差值取绝对值后相加以作为此小段的差值总和。在本专利技术的一实施例中,在上述根据播放速度及各个小段的差值总和,将所播放 音频数据的部分小段扔掉或重复,以播放音频数据的步骤的前,更包括计算接着要播放的 N个小段的差值总和,并将此N个小段的差值总和排序,以作为后续将所播放音频数据的部 分小段扔掉或重复的依据,其中N为正整数。在本专利技术的一实施例中,上述根据播放速度及各个小段的差值总和,将所播放音 频数据的部分小段扔掉或重复,以播放音频数据的步骤包括根据播放速度的一倍数M以及 所述N个小段的差值总和的分布,其中M为正数,调整所播放音频数据的小段的比例,以播 放音频数据。在本专利技术的一实施例中,上述根据播放速度及各个小段的差值总和,将所播放音 频数据的部分小段扔掉或重复,以播放音频数据的步骤包括在执行一快速播放时,扔掉所 述N个小段中差值总和较小的部分小段,以播放音频数据;而在执行一慢速播放时,则重复 所述N个小段中差值总和较小的部分小段,以播放音频数据。本专利技术提出一种变速不变调的声音播放装置,其包括运算单元及播放单元。其中, 运算单元用以取得切分为多个小段的音频数据,并计算每一个小段中多个频率分量的能量 与其前一个小段中对应频率分量的能量的差值总和。播放单元则会根据一播放速度以及由 运算单元所计算的各个小段的差值总和,将所播放的音频数据的部分小段扔掉或重复,以 播放音频数据。在本专利技术的一实施例中,上述的运算单元包括在接收到音频数据时,即将此音频 数据切分为多个小段。在本专利技术的一实施例中,上述的运算单元包括将各个小段区分为多个FFT频点, 并分别计算各个FFT频点的能量值以作为各个频率分量的能量。在本专利技术的一实施例中,上述的运算单元包括将各个小段区分为滤波器组的多个 子带,并计算各个子带的能量值以作为各个频率分量的能量。在本专利技术的一实施例中,上述的声音播放装置更包括一个解压缩单元,其用以接 收并解压缩一笔压缩音频数据,以取得所述切分成多个小段的音频数据以及各个小段的频率分量的能量。在本专利技术的一实施例中,上述的运算单元包括分别计算每一个小段中各个频率分 量的能量与其前一个小段中对应频率分量的能量的差值,而将每一个小段中所有频率分量 对应的差值取绝对值后相加以作为此小段的差值总和。在本专利技术的一实施例中,上述的运算单元包括计算接着要播放的N个小段的差值 总和,并将此N个小段的差值总和排序,以作为后续将调整所播放音频数据的部分小段扔 掉或重复的依据,其中N为正整数。在本专利技术的一实施例中,上述的播放单元包括根据所述播放速度的倍数M以及所 述N个小段的差值总和的分布,其中M为正数,调整所播放音频数据的小段的比例,以播放音频数据。在本专利技术的一实施例中,上述的播放单元包括在执行快速播放时,将所述N个小 段中差值总和较小的部分小段扔掉,以播放音频数据;而在执行慢速播放时,则将所述N个 小段中差值总和较小的部分小段重复,以播放音频数据。基于上述,本专利技术的变速不变调的声音播放方法及装置通过将音频数据区分为多 个小段,并分别比较相邻小段间的差异,藉以找出声音的变化部分。在快速或慢速播放音频 数据时,本专利技术则根据前述差异动态调整所播放音频数据,本文档来自技高网
...

【技术保护点】
一种变速不变调的声音播放方法,包括:取得切分为多个小段的一音频数据,其中各该些小段包括多个频率分量,且各该些频率分量具有一能量;计算每一该些小段中该些频率分量的能量与其前一个小段中对应频率分量的能量的一差值总和;以及根据一播放速度及各该些小段的该差值总和,将所播放该音频数据的该些小段中的一部分扔掉或重复,以播放该音频数据。

【技术特征摘要】

【专利技术属性】
技术研发人员:陈岳勇
申请(专利权)人:珠海扬智电子有限公司
类型:发明
国别省市:44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1