一种音频检测方法、计算设备及计算机可读存储介质技术

技术编号：42493743 阅读：23 留言：0更新日期：2024-08-21 13:11

本申请公开了一种音频检测方法、计算设备及计算机可读存储介质，涉及语音处理技术领域。该方法包括:针对实时音频流中的待检测音频段，对待检测音频段中每一音频帧进行特征提取，得到每一音频帧对应的第一特征信息；针对任一音频帧，根据音频帧的第一特征信息和音频帧在待检测音频段中的参考音频帧的第一特征信息，得到音频帧的第二特征信息；将待检测音频段中各音频帧的第二特征信息通过分类器，得到每个音频帧的语音有效性识别结果；语音有效性识别结果包括有效帧、噪声帧或静音帧。上述的音频检测方法，可以准确的判断出无效语音，也就是噪声的起止时间，从而准确的剔除无效语音，提高了音频检测精准性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及语音处理，尤其涉及一种音频检测方法、计算设备及计算机可读存储介质。

技术介绍

1、在人机交互过程中，由于外部环境的不稳定性，往往会存在噪声干扰，因而需要对人机交互过程中的音频进行检测，排除噪声干扰，保证人机交互过程中音频的质量，从而能够更加准确地明白用户的意图。

2、在现有技术中，对音频进行检测时，会先将音频划分成多个音频段，每个音频段中包含多帧，将音频段的特征输入到神经网络模型中，确定该音频段是否为有效，即包含噪声的音频段为无效音频。在检测音频段无效后，就会进行整段的丢弃。由于整个音频段中可能还包含有效的语音帧，整段丢弃后，在传递给下一端进行后续操作时就难以保证音频的准确性了。因而，现有技术对音频的检测是笼统的，无法提供准确的音频检测。

3、综上，为提高音频检测的准确性，本申请提供了一种音频检测方法。

技术实现思路

1、本申请提供一种音频检测方法及装置，能够准确的判断出无效语音的起止时间，从而准确的剔除无效语音，提高了音频检测精准性。

2、第...

【技术保护点】

1.一种音频检测方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，根据所述音频帧的第一特征信息和所述音频帧在所述待检测音频段中的参考音频帧的第一特征信息，得到所述音频帧的第二特征信息，包括：

3.如权利要求2所述的方法，其特征在于，将所述待检测音频段中各音频帧的第一特征信息输入至长短期记忆网络LSTM，得到所述待检测音频段中每一音频帧的第二特征信息，包括：

4.如权利要求1所述的方法，其特征在于，所述LSTM包括顺序级联的多个LSTM处理层。

5.如权利要求1-4任一所述的方法，其特征在于，所述分类器包括全连接层和逻辑回归层...

【技术特征摘要】

1.一种音频检测方法，其特征在于，包括：

3.如权利要求2所述的方法，其特征在于，将所述待检测音频段中各音频帧的第一特征信息输入至长短期记忆网络lstm，得到所述待检测音频段中每一音频帧的第二特征信息，包括：

4.如权利要求1所述的方法，其特征在于，所述lstm包括顺序级联的多个lstm处理层。

5.如权利要求1-4任一所述的方法，其特征在于，所述分类器包括全连接层和逻辑回归层；

6.如权利要求5所述的方法，其特征在于，所述lstm和所述分类器是通过样本数据集进行训练得到的；所述样本数据集中任一样本是将噪声...

【专利技术属性】
技术研发人员：陈逸飞，吕强，李铁铮，
申请(专利权)人：上海上湖信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人