音频处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号：33121030 阅读：23 留言：0更新日期：2022-04-17 00:20

本申请涉及一种音频处理方法、装置、计算机设备和存储介质。所述方法包括：获取音频信号中当前音频片段的语音信息密度和语音信息量；所述语音信息密度用于衡量语音信息波动的频繁程度；基于所述语音信息密度和所述语音信息量，确定所述当前音频片段的目标停顿时长；获取所述音频信号中当前音频片段与在后音频片段间的语音间隔时长；若所述语音间隔时长小于所述目标停顿时长，则在所述当前音频片段与所述在后音频片段间插入停顿片段。采用本方法能够提高音频内容传达的有效性。能够提高音频内容传达的有效性。能够提高音频内容传达的有效性。

全部详细技术资料下载

【技术实现步骤摘要】
音频处理方法、装置、计算机设备和存储介质

[0001]本申请涉及计算机
，特别是涉及一种音频处理方法、装置、计算机设备、存储介质和计算机程序。

技术介绍

[0002]在一些音频内容节目中，当说话人语速较快且连续不间断的语音内容较多时，听众容易出现没跟上说话内容而导致没听懂、没理解，前段语音内容还没听懂的情况下进而错过后段的语音内容，影响接下来的其它段语音内容接收和理解。
[0003]传统技术中，通常是对语速过快的音频进行降速。然而，传统的通过降速的音频处理方法，可以让听者对音频内容听得更清楚，但听者不一定可以充分理解和吸收音频内容，存在音频内容传达的有效性不高的问题。

技术实现思路

[0004]基于此，有必要针对上述技术问题，提供一种能够提高音频内容传达的有效性的音频处理方法、装置、计算机设备和存储介质。
[0005]一种音频处理方法，所述方法包括：
[0006]获取音频信号中当前音频片段的语音信息密度和语音信息量；所述语音信息密度用于衡量语音信息波动的频繁程度；
[00...

【技术保护点】

【技术特征摘要】
1.一种音频处理方法，其特征在于，所述方法包括：获取音频信号中当前音频片段的语音信息密度和语音信息量；所述语音信息密度用于衡量语音信息波动的频繁程度；基于所述语音信息密度和所述语音信息量，确定所述当前音频片段的目标停顿时长；获取所述音频信号中当前音频片段与在后音频片段间的语音间隔时长；若所述语音间隔时长小于所述目标停顿时长，则在所述当前音频片段与所述在后音频片段间插入停顿片段。2.根据权利要求1所述的方法，其特征在于，所述获取音频信号中当前音频片段的语音信息密度和语音信息量之前，所述方法还包括：依次获取音频信号中各个音频帧，并检测各个音频帧的语音信息；基于各个音频帧的语音信息，确定出当前音频片段。3.根据权利要求2所述的方法，其特征在于，所述基于各个音频帧的语音信息，确定出当前音频片段，包括：将所述音频信号中第一个语音帧作为音频片段的开始节点，或者将上一个音频片段结束后的第一个语音帧作为音频片段的开始节点；其中，所述语音帧为语音信息满足语音活跃条件的音频帧；若在所述开始节点之后存在连续的超过指定数量的非语音帧，则基于所述连续的超过指定数量的非语音帧，确定音频片段的结束节点；其中，所述非语音帧为语音信息不满足语音活跃条件的音频帧；基于所述开始节点和所述结束节点，确定当前音频片段。4.根据权利要求3所述的方法，其特征在于，所述将上一个音频片段结束后的第一个语音帧作为音频片段的开始节点，包括：对于当前获取到的当前音频帧，若当前的开始标记参数为第一值、且当前音频帧为语音帧，则将所述当前音频帧作为音频片段的开始节点，并将所述开始标记参数从第一值调整为第二值；其中，在检测到存在连续的指定数量的非语音帧的情况下，所述开始标记参数从第二值被调整为第一值。5.根据权利要求3所述的方法，其特征在于，所述若在所述开始节点之后存在连续的超过指定数量的非语音帧，则基于所述连续的超过指定数量的非语音帧，确定音频片段的结束节点，包括：对于所述开始节点之后的音频帧，若当前音频帧为非语音帧，则在非语音计数值上加一；若所述当前音频帧为语音帧，则将所述非语音计数值置零；若所述非语音计数值小于或等于所述指定数量，则将下个音频帧作为当前音频帧并返回所述若当前音频帧为非语音帧，则在非语音计数值上加一的步骤继续执行，直至所述非语音计数值超过所述指定数量；将连续的所述指定数量的非语音帧中的最后一个非语音帧，作为音频片段的结束节点。6.根据权利要求3所述的方法，其特征在于，所述若在所述开始节点之后存在连续的超过指定数量的非语音帧，则基于所述连续的超过指定数量的非语音帧，确定音频片段的结
束节点，包括：对于所述开始节点之后的音频帧，若当前音频帧为非语音帧，则在非语音计数值上加一；若所述当前音频帧为语音帧，则将所述非语音计数值置零；若所述非语音计数值小于或等于所述指定数量，则将下个音频帧作为当前音频帧并返回所述若当前音频帧为非语音帧，则在非语音计数值上加一的步骤继续执行，直至所述非语音计数值在超过所述指定数量后被置零；将触发所述非语音计数值被置零的语音帧之前的前一帧，作为音频片段的结束节点。7.根据权利要求3所述的方法，其特征在于，所述方法还包括：若在所述开始节点之后存在连续的超过指定数量的非语音帧，则将所述连续的超过指定数量的非语音帧之后出现的首个语音帧，作为下一个音频片段的开始节点。8.根据权利要求1所述的方法，其特征在于，所述获取音频信号中当前音频片段的语音信息密度和语音信息量，包括：获取音频信号中的当前音频片段；对所述当前音频片段中各音频帧进行基音频率检测，得到所述当前音频片段的基音频率波动次数；所述基音频率波动次数表征语音信息量；确定所述当前音频片段的语音时长；基于所述基音频率波动次数与所述语音时长之间的对比值，确定所述当前音频片段的语音信息密度。9.根据权利要求8所述的...

【专利技术属性】
技术研发人员：梁俊斌，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人