音频编码方法及装置、电子设备、存储介质制造方法及图纸

技术编号:26602233 阅读:21 留言:0更新日期:2020-12-04 21:25
本发明专利技术提供了一种音频编码方法及装置、电子设备、存储介质,该方法包括:对待编码音频数据进行语音端点检测处理,以将待编码音频数据中的活动音频段和非活动音频段相分割;对于每一个活动音频段,利用其每一个粒度中每一子带的能量值计算其粒度平均能量;根据每一个活动音频段的粒度平均能量确定每一个活动音频段的编码码率,其中,活动音频段的编码码率与活动音频段的粒度平均能量正相关;对于每一个活动音频段,按照其编码码率对其进行音频编码;对待编码音频数据分割得到的非活动音频段进行编码,且每一个活动音频段的编码码率大于每一个非活动音频段的编码码率。本发明专利技术能够有利于提高编码质量,减少编码后的音频失真。

【技术实现步骤摘要】
音频编码方法及装置、电子设备、存储介质
本专利技术涉及音频编码
,尤其涉及一种音频编码方法及装置、电子设备、存储介质。
技术介绍
目前,为了便于音频的网络传输和存储,通常需要采用音频编码技术将原始音频数据转换为压缩数据,压缩后的数据数据量更少,从而有利于节省存储空间以及减少网络传输所需要的网络带宽,但是,通常情况下,编码后容易造成音频失真。
技术实现思路
基于上述现状,本专利技术的主要目的在于提供一种音频编码方法及装置、电子设备、存储介质,有利于减少编码后的音频失真。为实现上述目的,本专利技术的技术方案提供了一种音频编码方法,包括:步骤S1:对待编码音频数据进行语音端点检测处理,以将所述待编码音频数据中的活动音频段和非活动音频段相分割,得到若干音频段;步骤S2:对每一个所述活动音频段进行分块处理得到若干个粒度,再对每一个粒度进行子带分解并计算每一个粒度中每一子带的能量值,之后对于每一个所述活动音频段,利用其每一个粒度中每一子带的能量值计算其粒度平均能量;步骤S3:根据每一个所述活动音频段的粒度平均能量确定每一个所述活动音频段的编码码率,其中,活动音频段的编码码率与活动音频段的粒度平均能量正相关;步骤S4:对于每一个所述活动音频段,按照其编码码率对其进行音频编码;步骤S5:对所述待编码音频数据分割得到的非活动音频段进行编码,且每一个所述活动音频段的编码码率大于每一个所述非活动音频段的编码码率。进一步地,步骤S2包括:步骤S21:对所述待编码音频数据分割得到的第k个活动音频段进行分块处理,得到若干个粒度,k=1,2,3,…,L,L为所述待编码音频数据分割得到的活动音频段的数量;步骤S22:对所述第k个活动音频段的每一个粒度进行子带分解操作,然后对于所述第k个活动音频段的每一个粒度,计算其每一子带的能量值;其中,W(k,i)[sb]为所述第k个活动音频段的第i个粒度中第sb子带的能量值,SP(k,i)[sb][j]为所述第k个活动音频段的第i个粒度中第sb子带的第j频率线的频谱值,sb表示子带号,sb=1,2,3,…,N,N为每一个粒度中的子带数量,j表示频率线号,Z为每一子带的频率线数量,a为大于1的预设值;步骤S23:计算所述第k个活动音频段在每一子带上的能量分布值;其中,Dk[sb]为所述第k个活动音频段在第sb子带上的能量分布值,grs_k为所述第k个活动音频段分块处理后得到的粒度数量;步骤S24:确定所述第k个活动音频段的粒度平均能量EDSk;进一步地,所述根据每一个所述活动音频段的粒度平均能量确定每一个所述活动音频段的编码码率,包括:获取所述待编码音频数据的总体目标编码码率;根据所述待编码音频数据的总体目标编码码率、每一个所述非活动音频段的编码码率、每一个所述活动音频段的粒度平均能量计算每一个所述活动音频段的编码码率。进一步地,所述活动音频段的编码码率与活动音频段的粒度平均能量正相关,包括:各所述活动音频段的编码码率之间的比例与各所述活动音频段的粒度平均能量之间的比例一致。进一步地,所述非活动音频段的编码码率为所述音频编码方法对应的编码格式支持的最低编码码率。为实现上述目的,本专利技术的技术方案还提供了一种音频编码装置,包括:语音端点检测处理模块,用于对待编码音频数据进行语音端点检测处理,以将所述待编码音频数据中的活动音频段和非活动音频段相分割,得到若干音频段;计算模块,用于对每一个所述活动音频段进行分块处理得到若干个粒度,再对每一个粒度进行子带分解并计算每一个粒度中每一子带的能量值,之后对于每一个所述活动音频段,利用其每一个粒度中每一子带的能量值计算其粒度平均能量;码率确定模块,用于根据每一个所述活动音频段的粒度平均能量确定每一个所述活动音频段的编码码率,其中,活动音频段的编码码率与活动音频段的粒度平均能量正相关;第一编码处理模块,用于对于每一个所述活动音频段,按照其编码码率对其进行音频编码;第二编码处理模块,用于对所述待编码音频数据分割得到的非活动音频段进行编码,且每一个所述活动音频段的编码码率大于每一个所述非活动音频段的编码码率。为实现上述目的,本专利技术的技术方案还提供了一种音频编码装置,包括处理器以及与所述处理器耦合的存储器,其中,所述存储器中存储有指令,以供所述处理器执行,当所述处理器执行所述指令时,能实现根据上述的音频编码方法。为实现上述目的,本专利技术的技术方案还提供了一种电子设备,包括上述的音频编码装置。进一步地,所述电子设备为音箱、录音笔、手机、智能平板、笔记本电脑、台式电脑或电子玩具。为实现上述目的,本专利技术的技术方案还提供了一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现上述的音频编码方法。本专利技术提供的音频编码方法,通过对待编码音频数据进行语音端点检测处理,将其中的活动音频段和非活动音频段相分割,并对粒度平均能量较大的活动音频段设置较大的编码码率,对粒度平均能量较小的活动音频段设置较小的编码码率,同时使每一个活动音频段的编码码率大于每一个非活动音频段的编码码率,能够有效提高编码质量,减少编码后的音频失真。附图说明通过以下参照附图对本专利技术实施例的描述,本专利技术的上述以及其它目的、特征和优点将更为清楚,在附图中:图1是本专利技术实施例提供的一种音频编码方法的流程图。具体实施方式以下基于实施例对本专利技术进行描述,但是本专利技术并不仅仅限于这些实施例。在下文对本专利技术的细节描述中,详尽描述了一些特定的细节部分,为了避免混淆本专利技术的实质,公知的方法、过程、流程、元件并没有详细叙述。此外,本领域普通技术人员应当理解,在此提供的附图都是为了说明的目的,并且附图不一定是按比例绘制的。除非上下文明确要求,否则整个说明书和权利要求书中的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义;也就是说,是“包括但不限于”的含义。在本专利技术的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本专利技术的描述中,除非另有说明,“多个”的含义是两个或两个以上。参见图1,图1是本专利技术实施例提供了一种音频编码方法的流程图,该音频编码方法包括:步骤S1:对待编码音频数据进行语音端点检测处理,以将所述待编码音频数据中的活动音频段和非活动音频段相分割,得到若干音频段;通过语音端点检测(VAD)处理可以检测待编码音频数据中语音的起始和结束,例如,该步骤中,可以采用基于门限、统计模型或机器学习(如神经网络)的VAD算法对待编码音频数据进行语音端点检测处理;例如,所述活动音频段可以为音频特征满足预设条件的音频段,所述非活动音频段为音频特征不满足所述预设条件的音频段,上述预设条件可以根据具体需求进行设置,音频特征可以包括能量特本文档来自技高网...

【技术保护点】
1.一种音频编码方法,其特征在于,包括:/n步骤S1:对待编码音频数据进行语音端点检测处理,以将所述待编码音频数据中的活动音频段和非活动音频段相分割,得到若干音频段;/n步骤S2:对每一个所述活动音频段进行分块处理得到若干个粒度,再对每一个粒度进行子带分解并计算每一个粒度中每一子带的能量值,之后对于每一个所述活动音频段,利用其每一个粒度中每一子带的能量值计算其粒度平均能量;/n步骤S3:根据每一个所述活动音频段的粒度平均能量确定每一个所述活动音频段的编码码率,其中,活动音频段的编码码率与活动音频段的粒度平均能量正相关;/n步骤S4:对于每一个所述活动音频段,按照其编码码率对其进行音频编码;/n步骤S5:对所述待编码音频数据分割得到的非活动音频段进行编码,且每一个所述活动音频段的编码码率大于每一个所述非活动音频段的编码码率。/n

【技术特征摘要】
1.一种音频编码方法,其特征在于,包括:
步骤S1:对待编码音频数据进行语音端点检测处理,以将所述待编码音频数据中的活动音频段和非活动音频段相分割,得到若干音频段;
步骤S2:对每一个所述活动音频段进行分块处理得到若干个粒度,再对每一个粒度进行子带分解并计算每一个粒度中每一子带的能量值,之后对于每一个所述活动音频段,利用其每一个粒度中每一子带的能量值计算其粒度平均能量;
步骤S3:根据每一个所述活动音频段的粒度平均能量确定每一个所述活动音频段的编码码率,其中,活动音频段的编码码率与活动音频段的粒度平均能量正相关;
步骤S4:对于每一个所述活动音频段,按照其编码码率对其进行音频编码;
步骤S5:对所述待编码音频数据分割得到的非活动音频段进行编码,且每一个所述活动音频段的编码码率大于每一个所述非活动音频段的编码码率。


2.根据权利要求1所述的方法,其特征在于,步骤S2包括:
步骤S21:对所述待编码音频数据分割得到的第k个活动音频段进行分块处理,得到若干个粒度,k=1,2,3,…,L,L为所述待编码音频数据分割得到的活动音频段的数量;
步骤S22:对所述第k个活动音频段的每一个粒度进行子带分解操作,然后对于所述第k个活动音频段的每一个粒度,计算其每一子带的能量值;



其中,W(k,i)[sb]为所述第k个活动音频段的第i个粒度中第sb子带的能量值,SP(k,i)[sb][j]为所述第k个活动音频段的第i个粒度中第sb子带的第j频率线的频谱值,sb表示子带号,sb=1,2,3,…,N,N为每一个粒度中的子带数量,j表示频率线号,Z为每一子带的频率线数量,a为大于1的预设值;
步骤S23:计算所述第k个活动音频段在每一子带上的能量分布值;



其中,Dk[sb]为所述第k个活动音频段在第sb子带上的能量分布值,grs_k为所述第k个活动音频段分块处理后得到的粒度数量;
步骤S24:确定所述第k个活动音频段的粒度平均能量EDSk;





3.根据权利要求1所述的方法,其特征在于,所述根据每一个所述活动音频段的粒度平均能量确定每一个所述活动音频段的编码码率,包括:
获取所述待编码音频数据的总体目标编码...

【专利技术属性】
技术研发人员:闫玉凤肖全之黄荣均方桂萍
申请(专利权)人:珠海市杰理科技股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1