音频编码方法及装置、电子设备、存储介质制造方法及图纸

技术编号：26602233 阅读：21 留言：0更新日期：2020-12-04 21:25

本发明专利技术提供了一种音频编码方法及装置、电子设备、存储介质，该方法包括：对待编码音频数据进行语音端点检测处理，以将待编码音频数据中的活动音频段和非活动音频段相分割；对于每一个活动音频段，利用其每一个粒度中每一子带的能量值计算其粒度平均能量；根据每一个活动音频段的粒度平均能量确定每一个活动音频段的编码码率，其中，活动音频段的编码码率与活动音频段的粒度平均能量正相关；对于每一个活动音频段，按照其编码码率对其进行音频编码；对待编码音频数据分割得到的非活动音频段进行编码，且每一个活动音频段的编码码率大于每一个非活动音频段的编码码率。本发明专利技术能够有利于提高编码质量，减少编码后的音频失真。

全部详细技术资料下载

【技术实现步骤摘要】
音频编码方法及装置、电子设备、存储介质
本专利技术涉及音频编码
，尤其涉及一种音频编码方法及装置、电子设备、存储介质。
技术介绍
目前，为了便于音频的网络传输和存储，通常需要采用音频编码技术将原始音频数据转换为压缩数据，压缩后的数据数据量更少，从而有利于节省存储空间以及减少网络传输所需要的网络带宽，但是，通常情况下，编码后容易造成音频失真。
技术实现思路
基于上述现状，本专利技术的主要目的在于提供一种音频编码方法及装置、电子设备、存储介质，有利于减少编码后的音频失真。为实现上述目的，本专利技术的技术方案提供了一种音频编码方法，包括：步骤S1：对待编码音频数据进行语音端点检测处理，以将所述待编码音频数据中的活动音频段和非活动音频段相分割，得到若干音频段；步骤S2：对每一个所述活动音频段进行分块处理得到若干个粒度，再对每一个粒度进行子带分解并计算每一个粒度中每一子带的能量值，之后对于每一个所述活动音频段，利用其每一个粒度中每一子带的能量值计算其粒度平均能量；步骤S3：根据每一个所述活动音频段的粒度平均能量确定每一个所述活动音频段的编码码率，其中，活动音频段的编码码率与活动音频段的粒度平均能量正相关；步骤S4：对于每一个所述活动音频段，按照其编码码率对其进行音频编码；步骤S5：对所述待编码音频数据分割得到的非活动音频段进行编码，且每一个所述活动音频段的编码码率大于每一个所述非活动音频段的编码码率。进一步地，步骤S2包括：步骤S21：对...

【技术保护点】
1.一种音频编码方法，其特征在于，包括：/n步骤S1：对待编码音频数据进行语音端点检测处理，以将所述待编码音频数据中的活动音频段和非活动音频段相分割，得到若干音频段；/n步骤S2：对每一个所述活动音频段进行分块处理得到若干个粒度，再对每一个粒度进行子带分解并计算每一个粒度中每一子带的能量值，之后对于每一个所述活动音频段，利用其每一个粒度中每一子带的能量值计算其粒度平均能量；/n步骤S3：根据每一个所述活动音频段的粒度平均能量确定每一个所述活动音频段的编码码率，其中，活动音频段的编码码率与活动音频段的粒度平均能量正相关；/n步骤S4：对于每一个所述活动音频段，按照其编码码率对其进行音频编码；/n步骤S5：对所述待编码音频数据分割得到的非活动音频段进行编码，且每一个所述活动音频段的编码码率大于每一个所述非活动音频段的编码码率。/n

【技术特征摘要】
1.一种音频编码方法，其特征在于，包括：
步骤S1：对待编码音频数据进行语音端点检测处理，以将所述待编码音频数据中的活动音频段和非活动音频段相分割，得到若干音频段；
步骤S2：对每一个所述活动音频段进行分块处理得到若干个粒度，再对每一个粒度进行子带分解并计算每一个粒度中每一子带的能量值，之后对于每一个所述活动音频段，利用其每一个粒度中每一子带的能量值计算其粒度平均能量；
步骤S3：根据每一个所述活动音频段的粒度平均能量确定每一个所述活动音频段的编码码率，其中，活动音频段的编码码率与活动音频段的粒度平均能量正相关；
步骤S4：对于每一个所述活动音频段，按照其编码码率对其进行音频编码；
步骤S5：对所述待编码音频数据分割得到的非活动音频段进行编码，且每一个所述活动音频段的编码码率大于每一个所述非活动音频段的编码码率。

2.根据权利要求1所述的方法，其特征在于，步骤S2包括：
步骤S21：对所述待编码音频数据分割得到的第k个活动音频段进行分块处理，得到若干个粒度，k＝1,2,3,…,L，L为所述待编码音频数据分割得到的活动音频段的数量；
步骤S22：对所述第k个活动音频段的每一个粒度进行子带分解操作，然后对于所述第k个活动音频段的每一个粒度，计算其每一子带的能量值；

其中，W(k,i)[sb]为所述第k个活动音频段的第i个粒度中第sb子带的能量值，SP(k,i)[sb][j]为所述第k个活动音频段的第i个粒度中第sb子带的第j频率线的频谱值，sb表示子带号，sb＝1,2,3,…,N，N为每一个粒度中的子带数量，j表示频率线号，Z为每一子带的频率线数量，a为大于1的预设值；
步骤S23：计算所述第k个活动音频段在每一子带上的能量分布值；

其中，Dk[sb]为所述第k个活动音频段在第sb子带上的能量分布值，grs_k为所述第k个活动音频段分块处理后得到的粒度数量；
步骤S24：确定所述第k个活动音频段的粒度平均能量EDSk；

3.根据权利要求1所述的方法，其特征在于，所述根据每一个所述活动音频段的粒度平均能量确定每一个所述活动音频段的编码码率，包括：
获取所述待编码音频数据的总体目标编码...

【专利技术属性】
技术研发人员：闫玉凤，肖全之，黄荣均，方桂萍，
申请(专利权)人：珠海市杰理科技股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人