音频数据风险检测方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：38271910 阅读：11 留言：0更新日期：2023-07-27 10:25

本发明专利技术公开了一种音频数据风险检测方法，该方法包括获取音频数据，对音频数据进行音频识别，得到音频识别结果；对音频数据进行语音识别，得到音频文本；对音频文本进行文本情绪识别，得到文本情绪识别结果；对音频数据进行特征提取，得到语音特征，并对语音特征进行语音情绪识别，确定语音情绪识别结果；根据音频识别结果、文本情绪识别结果和语音情绪识别结果，确定风险检测结果。本发明专利技术通过文本情绪识别结果和语音情绪识别结果对音频数据中的情绪进行识别，提高了情绪识别结果的准确率。通过文本情绪识别结果、语音情绪识别结果和音频识别结果对音频数据进行风险检测，充分利用了音频数据中的声纹信息，从而提高了风险检测结果的准确率

全部详细技术资料下载

【技术实现步骤摘要】
音频数据风险检测方法、装置、计算机设备及存储介质

[0001]本专利技术涉及语音处理
，尤其涉及一种音频数据风险检测方法、装置、计算机设备及存储介质。

技术介绍

[0002]随着科学技术不断的发展，语音处理技术也逐渐应用在不同的领域当中。比如，在风险检测场景下，通过将语音数据转换为文本信息，并对文本信息进行意图检测，以便针对意图检测结果采取相应的风险应对措施。
[0003]现有技术中，风险检测技术往往是通过风险信号标记、风险预测建模和文本风险挖掘进行风险预测，以及通过语音数据中的声纹特征与历史标记数据进行匹配，从而判断语音数据是否有违规、诈骗或刷单等风险。但是风险预测建模并不能覆盖所有场景，适用性差。只基于文本内容的风险检测结果的准确率不高，效果也不理想，也不能充分利用文本信息中的情感信息。而且通过声纹特征与历史标记数据进行匹配，也不能充分利于语音数据中的情感信息进行风险检测。

技术实现思路

[0004]本专利技术实施例提供一种音频数据风险检测方法、装置、计算机设备及存储介质，以解决现有技术中文本检测准确率低以及语音数据无法充分利用的问题。
[0005]一种音频数据风险检测方法，包括：
[0006]获取音频数据，通过预设声纹分析模型对所述音频数据进行音频识别，得到音频识别结果；
[0007]根据预设语音识别模型对所述音频数据进行语音识别，得到音频文本；
[0008]基于预设文本识别模型对所述音频文本进行文本情绪识别，得到文本情绪识别结果；
[000...

【技术保护点】

【技术特征摘要】
1.一种音频数据风险检测方法，其特征在于，包括：获取音频数据，通过预设声纹分析模型对所述音频数据进行音频识别，得到音频识别结果；根据预设语音识别模型对所述音频数据进行语音识别，得到音频文本；基于预设文本识别模型对所述音频文本进行文本情绪识别，得到文本情绪识别结果；对所述音频数据进行语音特征提取，得到语音特征，并对所述语音特征进行语音情绪识别，确定语音情绪识别结果；根据所述音频识别结果、所述文本情绪识别结果和所述语音情绪识别结果，确定风险检测结果。2.如权利要求1所述的音频数据风险检测方法，其特征在于，所述获取音频数据，包括：获取语音数据，并对所述语音数据进行分帧处理，得到与所述语音数据对应的分帧数据；对所有所述分帧数据进行端点检测，得到各所述分帧数据的起始点和终止点；根据各所述分帧数据的起始点和终止点对所述语音数据进行去噪处理，得到所述音频数据。3.如权利要求1所述的音频数据风险检测方法，其特征在于，所述预设声学分析模型包括第一卷积层、多个残差网络层、卷积池化层和全连接层；所述卷积池化层第二卷积层和注意力池化层；所述通过预设声纹分析模型对所述音频数据进行音频识别，得到音频识别结果，包括：对所述音频数据进行特征提取，得到音频特征；通过所述第一卷积层对所述音频特征进行卷积处理，得到卷积特征向量；将所述卷积特征向量输入至所述残差网络层中，并获取每一个所述残差网络层输出的残差特征向量；通过所述第二卷积层对所有残差网络层输出的所述残差特征向量进行卷积处理，得到语音特征向量；通过所述注意力池化层对所述语音特征向量进行向量处理，得到输出特征向量；通过所述全连接层对所述输出特征向量进行预测处理，得到所述音频识别结果。4.如权利要求3所述的音频数据风险检测方法，其特征在于，所述残差网络层包括第一残差网络层、第二残差网络层和第三残差网络层；所述将所述卷积特征向量输入至所述残差网络层中，并获取每一个所述残差网络层输出的残差特征向量，包括：将所述卷积特征向量输入所述第一残差网络层，通过所述第一残差网络层对所述卷积特征向量进行特征提取，得到第一特征向量；通过所述第二残差网络层对所述第一特征向量进行特征提取，得到第二特征向量；通过所述第三残差网络层对所述第二特征向量进行特征提取，得到第三特征向量；将所述第一特征向量、所述第二特征向量和所述第三特征向量记录为所述残差特征向量。5.如权利要求1所述的音频数据风险检测方法，其特征在于，所述预设语音识别模型包括编码器、时序分类解码器和注意力解码器；
所述根据预设语音识别模型对所述音频数据进行语音识别，得到音频文本，包括：通过所述编码器对所述音频数据进行编码处理，得到音频向量；通过所述时序分类解码器对所述音频向量进行流式解码，得到至少一个流式结果；通过...

【专利技术属性】
技术研发人员：曹子豪，王健宗，黄章成，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人