语音信号的处理方法及系统、音频处理芯片、电子设备技术方案

技术编号:26224683 阅读:14 留言:0更新日期:2020-11-04 10:59
本发明专利技术涉及一种包含丢包数据的语音信号的处理方法及系统、语音处理芯片、计算机可读介质、电子设备。处理方法包括:首先获取包含丢包数据的语音信号以及所述语音信号对应的丢包判断信号,其中,所述丢包判断信号包括语音信号中各音频数据包是否为丢包数据的信息;然后将所述语音信号转换为频域信号,记为第一信号,使用所述丢包判断信号生成调制信号;并使用所述调制信号对所述第一信号进行调制处理,得到预输出信号;接着对所述修正信号作傅里叶反变换,得到预输出信号。本发明专利技术的处理方法能够尽可能避免语音信号的重发以及降低传送带宽的负担,且能够提高语音信号的实时性。

【技术实现步骤摘要】
语音信号的处理方法及系统、音频处理芯片、电子设备
本专利技术涉及通讯
,具体涉及一种包含丢包数据的语音信号的处理方法及处理系统、音频处理芯片、电子设备、计算机可读存储介质。
技术介绍
随着无线连接的普及,基于蓝牙、wifi等的音频通讯几乎无处不在。但是,实际传输语音信号的过程中,受环境或者天线等因素的影响,在传输中常常会带入干扰,从而易造成语音信号发生丢包,对听感带来极大不适。现有技术中对抗丢包的方法,可以选择重发语音信号,但往往受带宽限制以及出于实时性的要求等因素,无法进行无限次的重发,造成传输的数据仍有问题;也有一些对抗丢包的方法中,会通过编码加入额外的冗余信息,用于进行纠错,这无疑会增加传输的数据量,增加带宽负担。
技术实现思路
基于上述现状,本专利技术的主要目的在于提供一种包含丢包数据的语音信号的处理方法及处理系统、音频处理芯片、电子设备、计算机可读存储介质,以解决现有技术由于重发或者加入编码造成带宽负担增加和降低实时性的问题。为实现上述目的,本专利技术采用的技术方案如下:本专利技术的第一方面提供了一种包含丢包数据的语音信号的处理方法,包括步骤:S100:获取包含丢包数据的语音信号以及所述语音信号对应的丢包判断信号,所述丢包判断信号为所述语音信号中各音频数据包的差错标志形成的序列,其中,若所述音频数据包中的数据为丢包数据包,则该数据对应的差错标志为0,否则为1;S300:对所述丢包判断信号进行傅里叶变换,并求能量谱,得到丢包能量谱,通过所述丢包能量谱生成所述调制信号;S400:将所述语音信号转换为语音频域信号,并求能量谱,得到语音能量谱;S500:选取所述语音能量谱中能量最大的L个峰值,以每一个能量最大的峰值作为主峰,并选取所述语音能量谱中该主峰左右两侧对称的多个次峰生成调制能量谱,然后通过所述调制信号和各所述调制能量谱生成对应各所述调制能量谱的增益系数,使用多个所述增益系数对所述语音频域信号进行多次调制修正处理,得到修正信号;其中,所述调制能量谱中各峰值的位置使用其所在的所述语音能量谱中的位置,且各所述调制能量谱中次峰的个数为其主峰所在语音能量谱中左侧次峰个数和右侧次峰个数较少的一者;S700:对所述修正信号作傅里叶反变换,得到预输出信号。优选地,所述步骤S100与S300之间还包括步骤:S2:判断所述语音信号是否包含有人声;若是,则执行S300;若否,则执行S600;S600:使用背景声估计频域能量谱生成修正信号,然后执行S700;其中,所述背景声估计频域能量谱为与当前语音信号最接近的不包含有丢包数据的语音信号生成的频域能量谱。优选地,所述步骤S300包括:S310:对所述丢包判断信号进行傅里叶变换,并求能量谱,得到丢包能量谱;S320:选出所述丢包能量谱中主瓣和与其相邻的部分旁瓣,并对其进行归一化处理,且所述主瓣的幅值使用其倒数代替,生成所述调制信号delta。优选地,所述步骤S500包括:S510:记所述语音能量谱为AMP,其能量最大的L个峰值记为AMP[Ki]i,以每一个AMP[Ki]i作为主峰,并选取所述语音能量谱中该主峰左右两侧的多个次峰生成调制能量谱,其中,AMP[Ki]i表示所述语音能量谱中的第i个峰值,其位于语音能量谱中的第Ki个位置;Ki为0、1、2、…、n-1;i为1、2、3、…、L;n为所述调制信号detla的长度;L大于等于4或者小于等于6;S520:设置i=1;S530:设置j=0,将所述语音频域信号中的第[Ki+j]个位置的值与delta[j]相乘,作为所述语音频域信号中的第[Ki+j]个位置处的值;其中,delta[j]指所述调制信号delta第j个位置的值;S540:计算j=j+1;判断rate1=1-delta[j]×AMP[Ki]i/AMP[Ki+j]i是否小于0;若是,则将所述第一信号中的第[Ki+j]个位置的值设置为0;若否,则将所述语音频域信号中的第[Ki+j]个位置的值与rate1相乘,作为所述第一信号中第[Ki+j]个位置的值;判断rate2=1-delta[j]×AMP[Ki]i/AMP[Ki-j]i是否小于0;若是,则将所述第一信号中的第[Ki-j]个位置的值设置为0;若否,则将所述语音频域信号中的第[Ki-j]个位置的值与rate2相乘,作为所述语音频域信号中第[Ki-j]个位置的值;S550:判断j是否小于n,如果小于n,则返回S540;若否,则执行S560;S560:判断i是否小于L+1,若是则i=i+1,返回S530;若否,则执行S570;S570:将修正后的语音频域信号作为修正信号;其中,每一个i值对应的delta[0]、各rate1、各rate2形成所述AMP[Ki]i对应的增益系数。优选地,所述调制信号delta的长度n=0.2×语音能量谱的长度。优选地,所述步骤S700之后还包括:S800:使用帧叠信号对所述预输出信号进行加窗帧叠,得到实际输出信号;S900:使用所述预输出信号更新所述帧叠信号;其中,所述帧叠信号的初始值为0。优选地,所述步骤S700之前还包括:S580:求所述修正信号的频域能量谱与相关性频域能量谱的相关度;S590:判断所述相关度是否小于预设相关性阈值,若是,则设置帧叠窗长为第一窗长;否则,设置帧叠窗长为第二窗长,其中,所述第二窗长大于所述第一窗长;所述步骤S800具体为:根据所述帧叠窗长使用所述帧叠信号对所述预输出信号进行加窗帧叠,得到实际输出信号,且使用所述修正信号的频域能量谱更新所述相关性频域能量谱;其中,所述相关性频域能量谱初始值为0。优选地,所述步骤S580包括:S581:在相关性频域能量谱中选取幅度最大的u个峰值,并记录其对应的位置,这些位置形成第一数组X;S582:对所述修正信号求能量谱,记为修正能量谱,选出所述修正能量谱中幅度最大的w个峰值,并记录其对应的位置,这些位置形成第二数组Y;S583:对所述第一数组X中的每一个X[m]在所述第二数组Y中寻找与其最接近的值,记为Y[v],则△[m]=|X[m]-Y[v]|,其中m为1、2、…、u;S584:所述相关度为所有△[m]之和;其中,u小于w。优选地,所述语音信号为通过蓝牙获得的语音信号。本专利技术的第二方面提供了一种包含丢包数据的语音信号的处理系统,包括:获取模块,用于获取包含丢包数据的语音信号以及所述语音信号对应的丢包判断信号;所述丢包判断信号为所述语音信号中各音频数据包的差错标志形成的序列,其中,若所述音频数据包的数据为丢包数据,则该数据对应的差错标志为0,否则为1;修正模块,用于对所述丢包判断信号进行傅里叶变换,并求能量谱,得到丢包能量谱,通过所述丢包能量谱生成所述调制信号;并将所述语音信号转换为语音频域信本文档来自技高网...

【技术保护点】
1.一种包含丢包数据的语音信号的处理方法,其特征在于,包括步骤:/nS100:获取包含丢包数据的语音信号以及所述语音信号对应的丢包判断信号,所述丢包判断信号为所述语音信号中各音频数据包的差错标志形成的序列,其中,若所述音频数据包中的数据为丢包数据包,则该数据对应的差错标志为0,否则为1;/nS300:对所述丢包判断信号进行傅里叶变换,并求能量谱,得到丢包能量谱,通过所述丢包能量谱生成所述调制信号;/nS400:将所述语音信号转换为语音频域信号,并求能量谱,得到语音能量谱;/nS500:选取所述语音能量谱中能量最大的L个峰值,以每一个能量最大的峰值作为主峰,并选取所述语音能量谱中该主峰左右两侧对称的多个次峰生成调制能量谱,然后通过所述调制信号和各所述调制能量谱生成对应各所述调制能量谱的增益系数,使用多个所述增益系数对所述语音频域信号进行多次调制修正处理,得到修正信号;其中,所述调制能量谱中各峰值的位置使用其所在的所述语音能量谱中的位置,且各所述调制能量谱中次峰的个数为其主峰所在语音能量谱中左侧次峰个数和右侧次峰个数较少的一者;/nS700:对所述修正信号作傅里叶反变换,得到预输出信号。/n...

【技术特征摘要】
1.一种包含丢包数据的语音信号的处理方法,其特征在于,包括步骤:
S100:获取包含丢包数据的语音信号以及所述语音信号对应的丢包判断信号,所述丢包判断信号为所述语音信号中各音频数据包的差错标志形成的序列,其中,若所述音频数据包中的数据为丢包数据包,则该数据对应的差错标志为0,否则为1;
S300:对所述丢包判断信号进行傅里叶变换,并求能量谱,得到丢包能量谱,通过所述丢包能量谱生成所述调制信号;
S400:将所述语音信号转换为语音频域信号,并求能量谱,得到语音能量谱;
S500:选取所述语音能量谱中能量最大的L个峰值,以每一个能量最大的峰值作为主峰,并选取所述语音能量谱中该主峰左右两侧对称的多个次峰生成调制能量谱,然后通过所述调制信号和各所述调制能量谱生成对应各所述调制能量谱的增益系数,使用多个所述增益系数对所述语音频域信号进行多次调制修正处理,得到修正信号;其中,所述调制能量谱中各峰值的位置使用其所在的所述语音能量谱中的位置,且各所述调制能量谱中次峰的个数为其主峰所在语音能量谱中左侧次峰个数和右侧次峰个数较少的一者;
S700:对所述修正信号作傅里叶反变换,得到预输出信号。


2.根据权利要求1所述的处理方法,其特征在于,所述步骤S100与S300之间还包括步骤:
S200:判断所述语音信号是否包含有人声;若是,则执行S300;若否,则执行S600;
S600:使用背景声估计频域能量谱生成修正信号,然后执行S700;其中,所述背景声估计频域能量谱为与当前语音信号最接近的不包含有丢包数据的语音信号生成的频域能量谱。


3.根据权利要求1所述的处理方法,其特征在于,所述步骤S300包括:
S310:对所述丢包判断信号进行傅里叶变换,并求能量谱,得到丢包能量谱;
S320:选出所述丢包能量谱中主瓣和与其相邻的部分旁瓣,并对其进行归一化处理,且所述主瓣的幅值使用其倒数代替,生成所述调制信号delta。


4.根据权利要求3所述的处理方法,其特征在于,所述步骤S500包括:
S510:记所述语音能量谱为AMP,其能量最大的L个峰值记为AMP[Ki]i,以每一个AMP[Ki]i作为主峰,并选取所述语音能量谱中该主峰左右两侧的多个次峰生成调制能量谱,其中,AMP[Ki]i表示所述语音能量谱中的第i个峰值,其位于语音能量谱中的第Ki个位置;Ki为0、1、2、…、n-1;i为1、2、3、…、L;n为所述调制信号detla的长度;L大于等于4或者小于等于6;
S520:设置i=1;
S530:设置j=0,将所述语音频域信号中的第[Ki+j]个位置的值与delta[j]相乘,作为所述语音频域信号中的第[Ki+j]个位置处的值;其中,delta[j]指所述调制信号delta第j个位置的值;
S540:计算j=j+1;
判断rate1=1-delta[j]×AMP[Ki]i/AMP[Ki+j]i是否小于0;若是,则将所述第一信号中的第[Ki+j]个位置的值设置为0;若否,则将所述语音频域信号中的第[Ki+j]个位置的值与rate1相乘,作为所述第一信号中第[Ki+j]个位置的值;
判断rate2=1-delta[j]×AMP[Ki]i/AMP[Ki-j]i是否小于0;若是,则将所述第一信号中的第[Ki-j]个位置的值设置为0;若否,则将所述语音频域信号中的第[Ki-j]个位置的值与rate2相乘,作为所述语音频域信号中第[Ki-j]个位置的值;
S550:判断j是否小于n,如果小于n,则返回S540;若否,则执行S560;
S560:判断i是否小于L+1,若是则i=i+1,返回S530;若否,则执行S570;
S570:将修正后的语音频域信号作为修正信号;
其中,每一个i值对应的delta[0]、各rate1、各rate2形成所述AMP[Ki]i对应的增益系数。


5.根据权利要求4所述的处理方法,其特征在于,所述调制信号delta的长度n=0.2×语音能量谱的长度。


6.根据权利要求1-5任一项所述的处理方法,其特征在于,所述步骤S700之后还包括:
S800:使用帧叠信号对所述预输出信号进行加窗帧叠,得到实际输出信号;
S900:使用所述预输出信号...

【专利技术属性】
技术研发人员:方桂萍肖全之
申请(专利权)人:珠海市杰理科技股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1