音频变换方法和设备技术

技术编号:3045067 阅读:163 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种音频变换方法,包括如下步骤:步骤一,从音频段中选取第一数据段和第二数据段;步骤二,将该第一数据段和第二数据段进行叠加;步骤三,对叠加后的音频数据进行采样;步骤四,对采样后的数据进行低通滤波。还公开了一种音频变换设备,包括:数据段选取单元,其从音频段中选取第一数据段和第二数据段;叠加单元,其将该第一数据段和第二数据段进行叠加;采样单元,对叠加后的数据进行采样;低通滤波器,对采样后的数据进行低通滤波。本发明专利技术的运算量很小,不需要高性能计算芯片或专用DSP,只需10MIPS的计算能力,且不改变原始语音长度,适用于实时通话,能够在计算能力和内存有限的移动终端上实现实时语音变声。

【技术实现步骤摘要】

本专利技术涉及一种音频处理方法和设备,特别涉及一种对音频的基频进行变换的方法和设备
技术介绍
修改基频可以改变语音的特征,使得听者不能识别说话人的身份,达到变声的效果。目前改变基频的方法有傅立叶变换频域迁移法、SOLA(synchronized Overlap and Add)算法、混合谐波随机算法等。但这些方法运算量较大,实时实现需要高性能计算机或专用DSP,增加终端设备的成本。另一个问题是会改变原始语音的长度,造成通话时实时传送的困难。
技术实现思路
本专利技术的目的是克服现有的变换方法运算量大和会改变语音长度的缺陷,提供一种运算量小并且不会改变原始语音长度的变换方法。为了实现上述目的,本专利技术采取了如下技术方案一种音频变换方法,包括如下步骤步骤一,从音频段中选取第一数据段和第二数据段;步骤二,将该第一数据段和第二数据段进行叠加;步骤三,对叠加后的音频数据进行采样;步骤四,对采样后的数据进行低通滤波。其中,该第一数据段和第二数据段通过以下方法确定首先,将音频段中的前W个数据取出,然后从第L0+n(n=0,1,2...Fmax)个点开始从该语音段中再取Wa个点,作为第一相关数据段,在该W个数据中最后的Wa个点取出,作为第二相关数据段,计算着两个数据段的互相关系数,将其中互相关系数最大点的第一相关数据段作为第一数据段,第二相关数据段作为第二数据段,其中,L0为音频段的长度,W为窗长度,Wa为第一和第二数据段的长度,Fmax为最大查找延时。其中,通过如下方法计算该第一比较数据段和第二比较数据段的互相关系数R=Σi=1Waxiyi,]]>其中,xi为第二比较数据段序列,yi为第一比较数据段序列。其中,W=Ln+Wa,Ln是叠加后输出音频段的长度,Ln=L0·N/M,其中,M是原始音频长度,N是叠加后的音频长度。步骤二中,采用如下方法将该第一数据段和第二数据段进行叠加Oi=(aiwi+bi(216-wi))/216,其中,Oi为叠加后的输出序列,ai为第二数据段序列,bi为第一数据段序列,wi为第二数据段中第i个点的叠加系数,各个点的叠加系数记录在一个叠加系数表中。其中,wi通过如下方法计算wi=[iWa×216],i∈1...Wa.]]>在将第一数据段和第二数据段叠加后,将随后Ln个点的输入语音序列加到输出序列的尾部。步骤三中,对输出序列的前Ln个点进行采样,采样率为M/N。步骤四中,所使用的低通滤波器为FIR型数字滤波器,其阶数为16·Max(M,N)/M+1。另外,所述音频段为一个音频帧,即L0=160,且Wa=60,Fmax=80。本专利技术还包括一种音频变换设备,包括数据段选取单元,其从音频段中选取第一数据段和第二数据段;叠加单元,其将该第一数据段和第二数据段进行叠加; 采样单元,对叠加后的数据进行采样;低通滤波器,对采样后的数据进行低通滤波。其中,该数据段选取单元包括数据提取单元,从音频段中选择第一比较数据段和第二比较数据段;相关性计算单元,计算第一比较数据段和第二比较数据段的互相关系数;选择单元,选取互相关系数最大的第一比较数据段和第二比较数据段最为第一数据段和第二数据段。叠加单元在完成数据段的叠加后,将随后Ln个点的输入语音序列加到输出序列的尾部。该采样单元对输出序列的前Ln个点进行采样,采样率为M/N,其中,M是原始音频长度,N是叠加后的音频长度。该低通滤波器为FIR型数字滤波器,其阶数为16·Max(M,N)/M+1。本专利技术的积极进步效果在于运算量很小,不需要高性能计算芯片或专用DSP,在通用CPU上即可实现,只需10MIPS的计算能力,且不改变原始语音长度,适用于实时通话,能够在计算能力和内存有限的移动终端上实现实时语音变声。附图说明图1为本专利技术中音频变换设备的逻辑框图。图2为本专利技术中方法的过程示意图。图3A、3B为本专利技术中选取数据段的示意图。具体实施例方式下面结合附图给出本专利技术较佳实施例,以详细说明本专利技术的技术方案。如图1所示,一种音频变换设备,包括 数据段选取单元10,其从音频段中选取第一数据段和第二数据段;叠加单元20,其将该第一数据段和第二数据段进行叠加;采样单元30,对叠加后的数据进行采样;低通滤波器40,对采样后的数据进行低通滤波。其中,该数据段选取单元10包括数据提取单元11,从音频段中选择第一比较数据段和第二比较数据段;相关性计算单元12,计算第一比较数据段和第二比较数据段的互相关系数;选择单元13,选取互相关系数最大的第一比较数据段和第二比较数据段最为第一数据段和第二数据段。叠加单元20在完成数据段的叠加后,将随后Ln个点的输入语音序列加到输出序列的尾部。该采样单元30的采样率为M/N,其中,M是原始音频长度,N是叠加后的音频长度。该低通滤波器40为FIR型数字滤波器,其阶数为16·Max(M,N)/M+1。如图2所示,在本专利技术的音频变换方法中,首先,输入相关的参数,即,原始音频长度M和叠加后的音频长度N(步骤100),它们的比可以为1/2、3/5、2/3、3/4、4/5、5/4、4/3、3/2、5/3或2/1,这10个比值对应了10种变声效果。如步骤110,选取一个音频帧为一个音频段,当将本专利技术应用在语音变换上时,由于语音通话采样率为8KHZ,一个语音帧长为20ms,则音频段定为160点,即,音频段的长度L0=160。然后利用数据选取单元10在音频段中选取第一数据段和第二数据段(如步骤120)。如图3A、3B所示,在一个音频段中,将音频段中的前W个数据取出,W为窗长度,W=Ln+Wa,Ln是叠加后输出音频段的长度,Ln=L0·N/M,Wa为第一和第二数据段的长度,对于上述10种变声效果,为了减少内存占用,M、N的比值简化为最小公约数(1/2、3/5、2/3、3/4、4/5、5/4、4/3、3/2、5/3或2/1),则Wa应为1、2、3、4、5的公倍数,且小于L0,如果取值大,效果就好,但是会增加计算量,综合考虑可以取Wa=60。在该W个数据中最后的Wa个点取出,作为第二相关数据段,然后从第L0+n(n=0,1,2...Fmax)个点开始从该语音段中再取Wa个点,作为第一相关数据段,在该W各数据中最后的Wa个点取出,作为第二相关数据段,Fmax为最大查找延时,取Fmax=80。也就是,选取第一相关数据段的过程进行Fmax,每次取点的起始点向后移动一位。可以通过数据提取单元11完成数据段的选取。利用相关性计算单元12计算着第二相关数据段和第一相关数据段的互相关系数,利用选择单元13选取其中互相关系数最大点的第一相关数据段作为第一数据段,第二相关数据段作为第二数据段。相关性计算单元12和选择单元13交互运行完成上述过程。其中,通过如下方法计算该第一比较数据段和第二比较数据段的互相关系数R=Σi=1Waxiyi,]]>其中,xi为第二比较数据段序列,yi为第一比较数据段序列。如步骤130,利用叠加单元20将该第一数据段和第二数据段进行叠加,可采用如下方法进行叠加Oi=(aiwi+bi(216-wi))/216,其中,Oi为叠加后的输出序列,ai为第二数据段序列,bi为第一本文档来自技高网...

【技术保护点】
一种音频变换方法,其特征在于,其包括如下步骤:步骤一,从音频段中选取第一数据段和第二数据段;步骤二,将该第一数据段和第二数据段进行叠加;步骤三,对叠加后的音频数据进行采样;步骤四,对采样后的数据进行低通滤波。

【技术特征摘要】
1.一种音频变换方法,其特征在于,其包括如下步骤步骤一,从音频段中选取第一数据段和第二数据段;步骤二,将该第一数据段和第二数据段进行叠加;步骤三,对叠加后的音频数据进行采样;步骤四,对采样后的数据进行低通滤波。2.根据权利要求1所述的音频变换方法,其特征在于,该第一数据段和第二数据段通过以下方法确定首先,将音频段中的前W个数据取出,然后从第L0+n(n=0,1,2...Fmax)个点开始从该语音段中再取Wa个点,作为第一相关数据段,在该W个数据中最后的Wa个点取出,作为第二相关数据段,计算两个相关数据段的互相关系数,将其中互相关系数最大点的第一相关数据段作为第一数据段,第二相关数据段作为第二数据段,其中,L0为音频段的长度,W为窗长度,Wa为第一和第二数据段的长度,Fmax为最大查找延时。3.根据权利要求2所述的音频变换方法,其特征在于,通过如下方法计算该第一比较数据段和第二比较数据段的互相关系数R=Σi=1Waxiyi,]]>其中,xi为第二比较数据段序列,yi为第一比较数据段序列。4.根据权利要求3所述的音频变换方法,其特征在于,W=Ln+Wa,Ln是叠加后输出音频段的长度,Ln=L0·N/M,其中,M是原始音频长度,N是叠加后的音频长度。5.根据1-4任一权利要求所述的音频变换方法,其特征在于,步骤二中,采用如下方法将该第一数据段和第二数据段进行叠加Oi=(aiwi+bi(216-wi))/216,其中,Oi为叠加后的输出序列,ai为第二数据段序列,bi为第一数据段序列,wi为第二数据段中第i个点的叠加系数,各个点的叠加系数记录在一个叠加系数表中。6.根据权利要求5所述的音频变换方法,其特征在于,wi通过如下方法计算wi=[iWa&t...

【专利技术属性】
技术研发人员:王卫华
申请(专利权)人:上海晨兴电子科技有限公司
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1