语音信号的处理方法及系统、音频处理芯片、电子设备技术方案

技术编号：26224683 阅读：14 留言：0更新日期：2020-11-04 10:59

本发明专利技术涉及一种包含丢包数据的语音信号的处理方法及系统、语音处理芯片、计算机可读介质、电子设备。处理方法包括：首先获取包含丢包数据的语音信号以及所述语音信号对应的丢包判断信号，其中，所述丢包判断信号包括语音信号中各音频数据包是否为丢包数据的信息；然后将所述语音信号转换为频域信号，记为第一信号，使用所述丢包判断信号生成调制信号；并使用所述调制信号对所述第一信号进行调制处理，得到预输出信号；接着对所述修正信号作傅里叶反变换，得到预输出信号。本发明专利技术的处理方法能够尽可能避免语音信号的重发以及降低传送带宽的负担，且能够提高语音信号的实时性。

全部详细技术资料下载

【技术实现步骤摘要】
语音信号的处理方法及系统、音频处理芯片、电子设备
本专利技术涉及通讯
，具体涉及一种包含丢包数据的语音信号的处理方法及处理系统、音频处理芯片、电子设备、计算机可读存储介质。
技术介绍
随着无线连接的普及，基于蓝牙、wifi等的音频通讯几乎无处不在。但是，实际传输语音信号的过程中，受环境或者天线等因素的影响，在传输中常常会带入干扰，从而易造成语音信号发生丢包，对听感带来极大不适。现有技术中对抗丢包的方法，可以选择重发语音信号，但往往受带宽限制以及出于实时性的要求等因素，无法进行无限次的重发，造成传输的数据仍有问题；也有一些对抗丢包的方法中，会通过编码加入额外的冗余信息，用于进行纠错，这无疑会增加传输的数据量，增加带宽负担。
技术实现思路
基于上述现状，本专利技术的主要目的在于提供一种包含丢包数据的语音信号的处理方法及处理系统、音频处理芯片、电子设备、计算机可读存储介质，以解决现有技术由于重发或者加入编码造成带宽负担增加和降低实时性的问题。为实现上述目的，本专利技术采用的技术方案如下：本专利技术的第一方面提供了一种包含丢包数据的语音信号的处理方法，包括步骤：S100：获取包含丢包数据的语音信号以及所述语音信号对应的丢包判断信号，所述丢包判断信号为所述语音信号中各音频数据包的差错标志形成的序列，其中，若所述音频数据包中的数据为丢包数据包，则该数据对应的差错标志为0，否则为1；S300：对所述丢包判断信号进行傅里叶变换，并求能量谱，得到丢包能量谱，通过...

【技术保护点】
1.一种包含丢包数据的语音信号的处理方法，其特征在于，包括步骤：/nS100：获取包含丢包数据的语音信号以及所述语音信号对应的丢包判断信号，所述丢包判断信号为所述语音信号中各音频数据包的差错标志形成的序列，其中，若所述音频数据包中的数据为丢包数据包，则该数据对应的差错标志为0，否则为1；/nS300：对所述丢包判断信号进行傅里叶变换，并求能量谱，得到丢包能量谱，通过所述丢包能量谱生成所述调制信号；/nS400：将所述语音信号转换为语音频域信号，并求能量谱，得到语音能量谱；/nS500：选取所述语音能量谱中能量最大的L个峰值，以每一个能量最大的峰值作为主峰，并选取所述语音能量谱中该主峰左右两侧对称的多个次峰生成调制能量谱，然后通过所述调制信号和各所述调制能量谱生成对应各所述调制能量谱的增益系数，使用多个所述增益系数对所述语音频域信号进行多次调制修正处理，得到修正信号；其中，所述调制能量谱中各峰值的位置使用其所在的所述语音能量谱中的位置，且各所述调制能量谱中次峰的个数为其主峰所在语音能量谱中左侧次峰个数和右侧次峰个数较少的一者；/nS700：对所述修正信号作傅里叶反变换，得到预输出信号。/n...

【技术特征摘要】
1.一种包含丢包数据的语音信号的处理方法，其特征在于，包括步骤：
S100：获取包含丢包数据的语音信号以及所述语音信号对应的丢包判断信号，所述丢包判断信号为所述语音信号中各音频数据包的差错标志形成的序列，其中，若所述音频数据包中的数据为丢包数据包，则该数据对应的差错标志为0，否则为1；
S300：对所述丢包判断信号进行傅里叶变换，并求能量谱，得到丢包能量谱，通过所述丢包能量谱生成所述调制信号；
S400：将所述语音信号转换为语音频域信号，并求能量谱，得到语音能量谱；
S500：选取所述语音能量谱中能量最大的L个峰值，以每一个能量最大的峰值作为主峰，并选取所述语音能量谱中该主峰左右两侧对称的多个次峰生成调制能量谱，然后通过所述调制信号和各所述调制能量谱生成对应各所述调制能量谱的增益系数，使用多个所述增益系数对所述语音频域信号进行多次调制修正处理，得到修正信号；其中，所述调制能量谱中各峰值的位置使用其所在的所述语音能量谱中的位置，且各所述调制能量谱中次峰的个数为其主峰所在语音能量谱中左侧次峰个数和右侧次峰个数较少的一者；
S700：对所述修正信号作傅里叶反变换，得到预输出信号。

2.根据权利要求1所述的处理方法，其特征在于，所述步骤S100与S300之间还包括步骤：
S200：判断所述语音信号是否包含有人声；若是，则执行S300；若否，则执行S600；
S600：使用背景声估计频域能量谱生成修正信号，然后执行S700；其中，所述背景声估计频域能量谱为与当前语音信号最接近的不包含有丢包数据的语音信号生成的频域能量谱。

3.根据权利要求1所述的处理方法，其特征在于，所述步骤S300包括：
S310：对所述丢包判断信号进行傅里叶变换，并求能量谱，得到丢包能量谱；
S320：选出所述丢包能量谱中主瓣和与其相邻的部分旁瓣，并对其进行归一化处理，且所述主瓣的幅值使用其倒数代替，生成所述调制信号delta。

4.根据权利要求3所述的处理方法，其特征在于，所述步骤S500包括：
S510：记所述语音能量谱为AMP，其能量最大的L个峰值记为AMP[Ki]i，以每一个AMP[Ki]i作为主峰，并选取所述语音能量谱中该主峰左右两侧的多个次峰生成调制能量谱，其中，AMP[Ki]i表示所述语音能量谱中的第i个峰值，其位于语音能量谱中的第Ki个位置；Ki为0、1、2、…、n-1；i为1、2、3、…、L；n为所述调制信号detla的长度；L大于等于4或者小于等于6；
S520：设置i＝1；
S530：设置j＝0，将所述语音频域信号中的第[Ki+j]个位置的值与delta[j]相乘，作为所述语音频域信号中的第[Ki+j]个位置处的值；其中，delta[j]指所述调制信号delta第j个位置的值；
S540：计算j＝j+1；
判断rate1＝1-delta[j]×AMP[Ki]i/AMP[Ki+j]i是否小于0；若是，则将所述第一信号中的第[Ki+j]个位置的值设置为0；若否，则将所述语音频域信号中的第[Ki+j]个位置的值与rate1相乘，作为所述第一信号中第[Ki+j]个位置的值；
判断rate2＝1-delta[j]×AMP[Ki]i/AMP[Ki-j]i是否小于0；若是，则将所述第一信号中的第[Ki-j]个位置的值设置为0；若否，则将所述语音频域信号中的第[Ki-j]个位置的值与rate2相乘，作为所述语音频域信号中第[Ki-j]个位置的值；
S550：判断j是否小于n，如果小于n，则返回S540；若否，则执行S560；
S560：判断i是否小于L+1，若是则i＝i+1，返回S530；若否，则执行S570；
S570：将修正后的语音频域信号作为修正信号；
其中，每一个i值对应的delta[0]、各rate1、各rate2形成所述AMP[Ki]i对应的增益系数。

5.根据权利要求4所述的处理方法，其特征在于，所述调制信号delta的长度n＝0.2×语音能量谱的长度。

6.根据权利要求1-5任一项所述的处理方法，其特征在于，所述步骤S700之后还包括：
S800：使用帧叠信号对所述预输出信号进行加窗帧叠，得到实际输出信号；
S900：使用所述预输出信号...

【专利技术属性】
技术研发人员：方桂萍，肖全之，
申请(专利权)人：珠海市杰理科技股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人