音频变换方法和设备技术

技术编号：3045067 阅读：163 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种音频变换方法，包括如下步骤：步骤一，从音频段中选取第一数据段和第二数据段；步骤二，将该第一数据段和第二数据段进行叠加；步骤三，对叠加后的音频数据进行采样；步骤四，对采样后的数据进行低通滤波。还公开了一种音频变换设备，包括：数据段选取单元，其从音频段中选取第一数据段和第二数据段；叠加单元，其将该第一数据段和第二数据段进行叠加；采样单元，对叠加后的数据进行采样；低通滤波器，对采样后的数据进行低通滤波。本发明专利技术的运算量很小，不需要高性能计算芯片或专用ＤＳＰ，只需１０ＭＩＰＳ的计算能力，且不改变原始语音长度，适用于实时通话，能够在计算能力和内存有限的移动终端上实现实时语音变声。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种音频处理方法和设备，特别涉及一种对音频的基频进行变换的方法和设备
技术介绍
修改基频可以改变语音的特征，使得听者不能识别说话人的身份，达到变声的效果。目前改变基频的方法有傅立叶变换频域迁移法、SOLA(synchronized Overlap and Add)算法、混合谐波随机算法等。但这些方法运算量较大，实时实现需要高性能计算机或专用DSP，增加终端设备的成本。另一个问题是会改变原始语音的长度，造成通话时实时传送的困难。
技术实现思路
本专利技术的目的是克服现有的变换方法运算量大和会改变语音长度的缺陷，提供一种运算量小并且不会改变原始语音长度的变换方法。为了实现上述目的，本专利技术采取了如下技术方案一种音频变换方法，包括如下步骤步骤一，从音频段中选取第一数据段和第二数据段；步骤二，将该第一数据段和第二数据段进行叠加；步骤三，对叠加后的音频数据进行采样；步骤四，对采样后的数据进行低通滤波。其中，该第一数据段和第二数据段通过以下方法确定首先，将音频段中的前W个数据取出，然后从第L0+n(n＝0，1，2...Fmax)个点开始从该语音段中再取Wa个点，作为第一相关数据段，在该W个数据中最后的Wa个点取出，作为第二相关数据段，计算着两个数据段的互相关系数，将其中互相关系数最大点的第一相关数据段作为第一数据段，第二相关数据段作为第二数据段，其中，L0为音频段的长度，W为窗长度，Wa为第一和第二数据段的长度，Fmax为最大查找延时。其中，通过如下方法计算该第一比较数据段和第二比较数据段的互相关系数R=Σi=1Waxiyi,]]&g...

【技术保护点】
一种音频变换方法，其特征在于，其包括如下步骤：步骤一，从音频段中选取第一数据段和第二数据段；步骤二，将该第一数据段和第二数据段进行叠加；步骤三，对叠加后的音频数据进行采样；步骤四，对采样后的数据进行低通滤波。

【技术特征摘要】
1.一种音频变换方法，其特征在于，其包括如下步骤步骤一，从音频段中选取第一数据段和第二数据段；步骤二，将该第一数据段和第二数据段进行叠加；步骤三，对叠加后的音频数据进行采样；步骤四，对采样后的数据进行低通滤波。2.根据权利要求1所述的音频变换方法，其特征在于，该第一数据段和第二数据段通过以下方法确定首先，将音频段中的前W个数据取出，然后从第L0+n(n＝0，1，2...Fmax)个点开始从该语音段中再取Wa个点，作为第一相关数据段，在该W个数据中最后的Wa个点取出，作为第二相关数据段，计算两个相关数据段的互相关系数，将其中互相关系数最大点的第一相关数据段作为第一数据段，第二相关数据段作为第二数据段，其中，L0为音频段的长度，W为窗长度，Wa为第一和第二数据段的长度，Fmax为最大查找延时。3.根据权利要求2所述的音频变换方法，其特征在于，通过如下方法计算该第一比较数据段和第二比较数据段的互相关系数R=Σi=1Waxiyi,]]>其中，xi为第二比较数据段序列，yi为第一比较数据段序列。4.根据权利要求3所述的音频变换方法，其特征在于，W＝Ln+Wa，Ln是叠加后输出音频段的长度，Ln＝L0·N/M，其中，M是原始音频长度，N是叠加后的音频长度。5.根据1-4任一权利要求所述的音频变换方法，其特征在于，步骤二中，采用如下方法将该第一数据段和第二数据段进行叠加Oi＝(aiwi+bi(216-wi))/216，其中，Oi为叠加后的输出序列，ai为第二数据段序列，bi为第一数据段序列，wi为第二数据段中第i个点的叠加系数，各个点的叠加系数记录在一个叠加系数表中。6.根据权利要求5所述的音频变换方法，其特征在于，wi通过如下方法计算wi=[iWa&t...

【专利技术属性】
技术研发人员：王卫华，
申请(专利权)人：上海晨兴电子科技有限公司，
类型：发明
国别省市：31[中国|上海]

全部详细技术资料下载我是这个专利的主人