用于数字音频数据的编码方法和解码方法技术

技术编号：3445993 阅读：144 留言：0更新日期：2012-04-11 18:40

用于数字音频数据的编码方法和解码方法，能够根据不同的数字内容并且无需牺牲话音清晰度而改变再现速度。该编码方法包括以下步骤：对于每一个预定的离散频率产生成对的数字化正弦波分量和余弦波分量，并且，通过使用该正弦波和余弦波分量，从以预定采样周期采样的数字语音数据中，提取该正弦波分量的幅度信息和该余弦波分量的幅度信息，帧数据包括各对根据相应离散频率所提取的正弦波分量幅度信息和余弦波分量幅度信息，其随后被作为编码音频数据的一部分而依次产生。（*该技术在2021年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及编码和解码以一预定时间采样的数字音频数据的方法。
技术介绍
有某些常规方法被称为信号波形的时基插值和展开法，其用于改变再现速度同时保持说话的音调周期(pitch period)和清晰度。这些方法也适用于语音编码。即在编码之前，语音数据曾经受到时标压缩，而在解码之后，该语音数据的时标被扩展，从而实现信息压缩。基本上，该信息压缩是通过在音调周期削去一个信号波形实现的，并且所压缩的信息基于在子波之间的间隔插入新的子波的信号波形插值而扩展。用于这个过程的方法包括时域调和定标(Time Domain HarmonicScaling，TDHS)和PICOLA(指针间隔控制重叠及添加)，它们是以三角形窗削去和插值、同时保持在该时域中语音间距的周期性的方法，并且是通过快速傅里叶变换在频域内削去和插值的方法。这些方法具有非周期性的和瞬变的部分处理问题，并且在解码方扩展量化语音数据的过程中很可能出现失真。在之前和之后的帧中保持语音间距的周期性的同时，插入子波的方法实际上也适用于当一个帧的子波或者信息在分组传输中完全丢失时的情况。在上述波形插值中作为在信息压缩上的改进而提出的方法包括基于时间频率插值(TFI)、典型波形插值(PWI)或者更常规的波形插值(WI)的编码方法。
技术实现思路
本专利技术人研究了上述的现有技术，并且发现以下问题。即，由于在解码中，带有再现速度改变功能的常规的语音数据编码方法被配置为编码数据而以较高优先级给予语音的音调信息，故它们可以被用于处理语音本身，但是不能施用于包括除语音以外声音的数字内容，例如音乐本身、带有音乐背景的声音等等。因此，...

【技术保护点】
一种数字音频数据的编码方法，包括以下步骤：在以第一周期采样的数字音频数据的频域中设定以预先确定的间距分隔开的离散频率；通过使用对应于所设定的每个所述离散频率的彼此成对的正弦分量和余弦分量，将各所述分量数字化，在每个第二周期上从所述数字音频数据中提取所述正弦分量和余弦分量对的幅度信息项；和作为编码音频数据的一部分，依次产生帧数据，该帧数据包括对应于相应的所述离散频率的正弦和余弦分量的幅度信息项对。

【技术特征摘要】

【专利技术属性】
技术研发人员：关口博司，
申请(专利权)人：卡纳斯数据株式会社，宾得株式会社，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人