确定CVSD编解码中参数的方法和设备技术

技术编号:20024590 阅读:24 留言:0更新日期:2019-01-06 03:56
本申请实施例涉及基于连续斜率可变增量调制CVSD的编解码方法和编解码设备。该方法包括:若待编码数据中的第n‑a个信号至第n个信号对应的a+1个编码值均为第一值,根据a的大小,确定该待处理数据中第n+1个信号对应的增量步长Δ,其中,Δ>0;根据该增量步长Δ,确定该第n+1个信号的量阶值b(n+1)。本申请实施例的基于CVSD的编解码方法和编解码设备,具有较强的鲁棒性,尤其在语音低速率传输场景中,具有较好的语音质量和较低的资源消耗。

【技术实现步骤摘要】
【国外来华专利技术】确定CVSD编解码中参数的方法和设备
本申请涉及数据处理领域,尤其涉及确定CVSD编解码中参数的方法和编解码设备。
技术介绍
随着移动物联网技术(IOT)、人工智能(AI)、语音识别等技术的快速发展,人类的沟通方式、生活方式发生了巨大的变化,人与机器之间的交互方式也变得多样化。最近几年发展起来的语音交互最为引人关注。智能音响、智能穿戴设备、语音助手等人机交互产品呈现井喷式发展,这些产品的背后都离不开语音编解码等技术的支持。语音编码主要包括波形编码、参数编码和混合编码。波形编码中的连续斜率可变增量调制(ContinuousVariableSlopeDeltaModulation,CVSD)语音编码是自适应增量调制算法的一种,擅长处理丢失和被损坏的语音采样,并且在要求较低速率传输语音的情况下具有较好的抗信道误码能力;对于工程实现而言,CVSD算法简单,占用的资源较少,硬件容易实现;在单路运用时无需采取码元和码组同步措施等优点,CVSD被广泛运用于各种场景中。CVSD是一种量阶值随着输入信号平均斜率大小而连续变化的增量调制方式,采用多个连续变化斜率的线段来逼近音频信号。但在实际运用中,若量阶值选取不合理,仍然会存在诸多问题和缺陷,如语音信号的编码解码误差较大,尤其在开始时间段,导致语音失真较为严重,例如会导致过载失真和颗粒失真。
技术实现思路
本申请提供了一种确定CVSD编解码中参数的方法和编解码设备,具有较强的鲁棒性,尤其在语音低速率传输场景中,具有较好的语音质量和较低的资源消耗。第一方面,提供了一种确定CVSD编码中参数的方法,该方法包括:获取待编码数据中的第n个信号的编码值c(n),所述待编码数据中的第n-a个信号至第n-1个信号对应的a个编码值相等且等于第一值,n为大于1的正整数,a为小于n的正整数;若所述第n个信号的编码值c(n)为所述第一值,根据a的大小,确定所述待处理数据中第n+1个信号对应的增量步长Δ,其中,Δ>0;根据所述增量步长Δ,确定所述第n+1个信号的量阶值b(n+1)。结合第一方面,在第一方面的一种实现方式中,所述根据a的大小,确定所述待处理数据中第n+1个信号对应的增量步长Δ,包括:若a小于第一阈值,确定增量步长Δ为多个预设值中的第一预设值;若a大于或者等于所述第一阈值,确定增量步长Δ为所述多个预设值中的第二预设值,所述第二预设值大于所述第一预设值。结合第一方面及其上述实现方式,在第一方面的另一种实现方式中,所述方法还包括:若a大于或者等于第二阈值,确定所述增量步长Δ不为0,所述第二阈值小于所述第一阈值。结合第一方面及其上述实现方式,在第一方面的另一种实现方式中,若a小于第二所述阈值或者所述第n个信号的编码值c(n)为第二值,确定所述增量步长Δ为0,所述第二值不等于所述第一值。结合第一方面及其上述实现方式,在第一方面的另一种实现方式中,根据所述第n个信号的量阶值b(n)与所述增量步长Δ,确定所述第n+1个信号的量阶值b(n+1)。结合第一方面及其上述实现方式,在第一方面的另一种实现方式中,确定所述第n个信号的量阶值b(n)与衰减因子的乘积;将所述乘积与所述增量步长Δ的和确定为所述第n+1个信号的量阶值b(n+1)。具体地,所述根据所述增量步长Δ,确定所述第n+1个信号的量阶值b(n+1),包括:根据下面的公式(1),确定所述第n+1个信号的量阶值b(n+1):其中,b(n)为所述第n个信号的量阶值,β为衰减因子,C为所述第二阈值。结合第一方面及其上述实现方式,在第一方面的另一种实现方式中,所述根据所述第n个信号的量阶值b(n)与所述增量步长Δ,确定所述第n+1个信号的量阶值b(n+1),包括:根据所述增量步长Δ,确定增长倍数,所述增长倍数大于1;将所述增长倍数、衰减因子与所述第n个信号的量阶值b(n)的乘积确定为所述第n+1个信号的量阶值b(n+1)。具体地,所述根据所述增量步长Δ,确定所述第n+1个信号的量阶值b(n+1),包括:根据下面的公式(2),确定所述第n+1个信号的量阶值b(n+1):其中,b(n)为所述第n个信号的量阶值,β为衰减因子,C为所述第二阈值。结合第一方面及其上述实现方式,在第一方面的另一种实现方式中,所述待编码数据为语音数据,所述衰减因子β满足β=1-T/τ,T为所述语音数据的周期,τ为所述语音数据的音节时间常数。结合第一方面及其上述实现方式,在第一方面的另一种实现方式中,所述方法还包括:根据所述第n个信号的编码值c(n)、所述第n个信号的估计值以及所述第n+1个信号的量阶值b(n+1),确定所述第n+1个信号的估计值确定所述第n+1个信号的采样值d(n+1)和所述第n+1个信号的估计值之间的差值e(n+1);根据所述差值e(n+1)的大小,确定所述第n+1个信号的编码值c(n+1)。结合第一方面及其上述实现方式,在第一方面的另一种实现方式中,所述根据所述差值e(n+1)的大小,确定所述第n+1个信号的编码值c(n+1),包括:若所述差值e(n+1)大于或者等于0,确定所述第n+1个信号的编码值c(n+1)为1;若所述差值e(n+1)小于0,确定所述第n+1个信号的编码值c(n+1)为0。结合第一方面及其上述实现方式,在第一方面的另一种实现方式中,所述第一值为1或0。结合第一方面及其上述实现方式,在第一方面的另一种实现方式中,所述根据所述第n个信号的编码值c(n)、所述第n个信号的估计值以及所述第n+1个信号的量阶值b(n+1),确定所述第n+1个信号的估计值包括:若所述第n个信号的编码值c(n)为1,将所述第n个信号的估计值与所述第n+1个信号的量阶值b(n+1)的和,确定为所述第n+1个信号的估计值若所述第n个信号的编码值c(n)为0,将所述第n个信号的估计值与所述第n+1个信号的量阶值b(n+1)的差,确定为所述第n+1个信号的估计值具体地,根据下面的公式(3),确定所述第n+1个信号的估计值其中,为所述第n个信号的估计值,b(n+1)为所述第n+1个信号的量阶值,c(n)为所述第n个信号的编码值。结合第一方面及其上述实现方式,在第一方面的另一种实现方式中,在所述获取待编码数据中的第n个信号的编码值c(n)之前,所述方法还包括:对原始数据进行上采样处理,获取所述待编码数据。结合第一方面及其上述实现方式,在第一方面的另一种实现方式中,所述对原始数据进行上采样处理,获取所述待编码数据,包括:按照插值算法,对所述原始数据进行上采样处理,获取所述待编码数据。结合第一方面及其上述实现方式,在第一方面的另一种实现方式中,所述对原始数据进行上采样处理,获取所述待编码数据,包括:在所述原始数据的相邻采样点之间补零,获取待处理数据;通过滤波器,对所述待处理数据进行滤波处理,获取所述待编码数据。因此,本申请实施例的确定CVSD编码中参数方法,采用自适应步长的CVSD编码方法,可以基于连续相同的编码值的个数,选择不同的增量步长,以便于调整量阶值的大小,从而快速跟踪原始语音信号的快慢变化。对比传统的CVSD编码方法中在前一时刻的语音信号估计值上增加或者减小固定的增量步长,尤其是针对低速率的语音信号,由于其每次的增量步长都是固定的,在算法刚开始时,初本文档来自技高网...

【技术保护点】
1.一种确定连续斜率可变增量调制CVSD编码中参数的方法,其特征在于,包括:获取待编码数据中的第n个信号的编码值c(n),所述待编码数据中的第n‑a个信号至第n‑1个信号对应的a个编码值相等且等于第一值,n为大于1的正整数,a为小于n的正整数;若所述第n个信号的编码值c(n)为所述第一值,根据a的大小,确定所述待处理数据中第n+1个信号对应的增量步长Δ,其中,Δ>0;根据所述增量步长Δ,确定所述第n+1个信号的量阶值b(n+1)。

【技术特征摘要】
【国外来华专利技术】1.一种确定连续斜率可变增量调制CVSD编码中参数的方法,其特征在于,包括:获取待编码数据中的第n个信号的编码值c(n),所述待编码数据中的第n-a个信号至第n-1个信号对应的a个编码值相等且等于第一值,n为大于1的正整数,a为小于n的正整数;若所述第n个信号的编码值c(n)为所述第一值,根据a的大小,确定所述待处理数据中第n+1个信号对应的增量步长Δ,其中,Δ>0;根据所述增量步长Δ,确定所述第n+1个信号的量阶值b(n+1)。2.根据权利要求1所述的方法,其特征在于,所述根据a的大小,确定所述待处理数据中第n+1个信号对应的增量步长Δ,包括:若a小于第一阈值,确定增量步长Δ为多个预设值中的第一预设值;若a大于或者等于所述第一阈值,确定增量步长Δ为所述多个预设值中的第二预设值,所述第二预设值大于所述第一预设值。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:若a大于或者等于第二阈值,确定所述增量步长Δ不为0,所述第二阈值小于所述第一阈值。4.根据权利要求3所述的方法,其特征在于,所述根据所述增量步长Δ,确定所述第n+1个信号的量阶值b(n+1),包括:根据所述第n个信号的量阶值b(n)与所述增量步长Δ,确定所述第n+1个信号的量阶值b(n+1)。5.根据权利要求4所述的方法,其特征在于,所述根据所述第n个信号的量阶值b(n)与所述增量步长Δ,确定所述第n+1个信号的量阶值b(n+1),包括:确定所述第n个信号的量阶值b(n)与衰减因子的乘积;将所述乘积与所述增量步长Δ的和确定为所述第n+1个信号的量阶值b(n+1)。6.根据权利要求4所述的方法,其特征在于,所述根据所述第n个信号的量阶值b(n)与所述增量步长Δ,确定所述第n+1个信号的量阶值b(n+1),包括:根据所述增量步长Δ,确定增长倍数,所述增长倍数大于1;将所述增长倍数、衰减因子与所述第n个信号的量阶值b(n)的乘积确定为所述第n+1个信号的量阶值b(n+1)。7.根据权利要求5或6所述的方法,其特征在于,所述待编码数据为语音数据,所述衰减因子β满足β=1-T/τ,T为所述语音数据的周期,τ为所述语音数据的音节时间常数。8.根据权利要求1至7中任一项所述的方法,其特征在于,所述方法还包括:根据所述第n个信号的编码值c(n)、所述第n个信号的估计值以及所述第n+1个信号的量阶值b(n+1),确定所述第n+1个信号的估计值确定所述第n+1个信号的采样值d(n+1)和所述第n+1个信号的估计值之间的差值e(n+1);根据所述差值e(n+1)的大小,确定所述第n+1个信号的编码值c(n+1)。9.根据权利要求7所述的方法,其特征在于,所述根据所述差值e(n+1)的大小,确定所述第n+1个信号的编码值c(n+1),包括:若所述差值e(n+1)大于或者等于0,确定所述第n+1个信号的编码值c(n+1)为1;若所述差值e(n+1)小于0,确定所述第n+1个信号的编码值c(n+1)为0。10.根据权利要求9所述的方法,其特征在于,所述第一值为1或0。11.根据权利要求1至10中任一项所述的方法,其特征在于,所述根据所述第n个信号的编码值c(n)、所述第n个信号的估计值以及所述第n+1个信号的量阶值b(n+1),确定所述第n+1个信号的估计值包括:若所述第n个信号的编码值c(n)为1,将所述第n个信号的估计值与所述第n+1个信号的量阶值b(n+1)的和,确定为所述第n+1个信号的估计值若所述第n个信号的编码值c(n)为0,将所述第n个信号的估计值与所述第n+1个信号的量阶值b(n+1)的差,确定为所述第n+1个信号的估计值12.根据权利要求1至11中任一项所述的方法,其特征在于,在所述获取待编码数据中的第n个信号的编码值c(n)之前,所述方法还包括:对原始数据进行上采样处理,获取所述待编码数据。13.根据权利要求12所述的方法,其特征在于,所述对原始数据进行上采样处理,获取所述待编码数据,包括:按照插值算法,对所述原始数据进行上采样处理,获取所述待编码数据。14.根据权利要求12所述的方法,其特征在于,所述对原始数据进行上采样处理,获取所述待编码数据,包括:在所述原始数据的相邻采样点之间补零,获取待处理数据;通过滤波器,对所述待处理数据进行滤波处理,获取所述待编码数据。15.一种确定连续斜率可变增量调制CVSD解码中参数的方法,其特征在于,包括:获取待解码码流中的第n个码值c(n),所述待解码码流中的第n-a个码值至第n-1个码值均为第一值,n为大于1的正整数,a为小于n的正整数;若所述第n个码值c(n)为所述第一值,根据a的大小,确定所述待解码码流中第n+1个码值c(n+1)对应的增量步长Δ,其中,Δ>0;根据所述增量步长Δ,确定所述第n+1个码值c(n+1)对应的量阶值b(n+1)。16.根据权利要求15所述的方法,其特征在于,所述根据a的大小,确定所述待解码码流中第n+1个码值c(n+1)对应的增量步长Δ,包括:若a小于第一阈值,确定增量步长Δ为多个预设值中的第一预设值;若a大于或者等于所述第一阈值,确定增量步长Δ为所述多个预设值中的第二预设值,所述第二预设值大于所述第一预设值。17.根据权利要求15或16所述的方法,其特征在于,所述方法还包括:若a大于或者等于第二阈值,确定所述增量步长Δ不为0,所述第二阈值小于所述第一阈值。18.根据权利要求15至17中任一项所述的方法,其特征在于,所述方法还包括:根据所述第n个码值c(n)、所述第n个码值c(n)对应的解码信号y(n)以及所述第n+1个码值c(n+1)对应的量阶值b(n+1),确定所述第n+1个码值c(n+1)对应的解码信号y(n+1);通过带通滤波器,对所...

【专利技术属性】
技术研发人员:郭红敬王鑫山李国梁蔡学锋李毅
申请(专利权)人:深圳市汇顶科技股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1