音频数据的监控处理方法和系统技术方案

技术编号：21895650 阅读：21 留言：0更新日期：2019-08-17 16:00

本发明专利技术实施例公开了一种音频数据的监控处理方法和系统，该音频数据的监控处理方法包括：获取多个音频样本文件；对多个音频样本文件进行预处理，并获取多个音频样本文件的标注信息；根据预处理后的多个音频样本文件得到多个梅尔频率倒谱系数MFCC特征矩阵；根据多个MFCC特征矩阵和场景信息采用tensorflow框架进行训练得到音频场景识别预测模型；获取监控音频数据，并使用音频场景预测模型对监控音频数据进行分析预测得到监控音频数据的场景信息。本发明专利技术无需借助音频转文字而是可以对监控音频本身进行识别判断说话人所处的场景(例如色情场景/普通场景/音乐场景)，做出场景预测，预警所监控环境下的异常行为。

Monitoring and Processing Method and System of Audio Data

全部详细技术资料下载

【技术实现步骤摘要】
音频数据的监控处理方法和系统
本专利技术实施例涉及音频处理
，具体涉及一种音频数据的监控处理方法和系统。
技术介绍
现有的音频监控技术，主要通过录入音频并存储，然后将音频转化为文字，再对文字进行识别从而实现音频监控。这种方式不是对音频本身进行识别，更不能达到实时预警。
技术实现思路
为此，本专利技术实施例提供一种音频数据的监控处理方法和系统，以解决现有技术中无法对音频本身进行识别，无法实时进行音频监控的问题。为了实现上述目的，本专利技术实施例提供如下技术方案：本专利技术第一方面的实施例公开了一种音频数据的监控处理方法，包括：获取多个音频样本文件；对所述多个音频样本文件进行预处理，并获取所述多个音频样本文件的标注信息，所述标注信息包括对应所述多个音频样本文件的多个场景信息；根据预处理后的多个音频样本文件得到多个梅尔频率倒谱系数MFCC特征矩阵；根据所述多个MFCC特征矩阵和所述场景信息采用预设框架进行训练得到音频场景识别预测模型；获取监控音频数据，并使用音频场景预测模型对所述监控音频数据进行分析预测得到所述监控音频数据的场景信息。进一步地，根据所述多个MFCC特征矩阵和所述多个场景信息采用所述预设框架进行训练得到所述音频场景识别预测模型，包括：将所述多个MFCC特征矩阵和所述多个场景信息分为训练集和验证集；根据所述训练集和预设训练参数采用tensorflow框架生成第一识别预测模型；通过所述验证集验证所述第一识别预设模型是否符合预设标准；如果所述第一识别预设模型不符合所述预设标准，则调整所述预设训练参数重新训练模型；如果所述第一识别预设模型符合所述预设标准...

【技术保护点】
1.一种音频数据的监控处理方法，其特征在于，包括：获取多个音频样本文件；对所述多个音频样本文件进行预处理，并获取所述多个音频样本文件的标注信息，所述标注信息包括对应所述多个音频样本文件的多个场景信息；根据预处理后的多个音频样本文件得到多个梅尔频率倒谱系数MFCC特征矩阵；根据所述多个MFCC特征矩阵和所述场景信息采用预设框架进行训练得到音频场景识别预测模型；获取监控音频数据，并使用音频场景预测模型对所述监控音频数据进行分析预测得到所述监控音频数据的场景信息。

【技术特征摘要】
1.一种音频数据的监控处理方法，其特征在于，包括：获取多个音频样本文件；对所述多个音频样本文件进行预处理，并获取所述多个音频样本文件的标注信息，所述标注信息包括对应所述多个音频样本文件的多个场景信息；根据预处理后的多个音频样本文件得到多个梅尔频率倒谱系数MFCC特征矩阵；根据所述多个MFCC特征矩阵和所述场景信息采用预设框架进行训练得到音频场景识别预测模型；获取监控音频数据，并使用音频场景预测模型对所述监控音频数据进行分析预测得到所述监控音频数据的场景信息。2.根据权利要求1所述的音频数据的监控处理方法，根据所述多个MFCC特征矩阵和所述多个场景信息采用所述预设框架进行训练得到所述音频场景识别预测模型，包括：将所述多个MFCC特征矩阵和所述多个场景信息分为训练集和验证集；根据所述训练集和预设训练参数采用tensorflow框架生成第一识别预测模型；通过所述验证集验证所述第一识别预设模型是否符合预设标准；如果所述第一识别预设模型不符合所述预设标准，则调整所述预设训练参数重新训练模型；如果所述第一识别预设模型符合所述预设标准，则将所述第一识别预设模型作为所述音频场景识别预测模型。3.根据权利要求1所述的音频数据的监控处理方法，其特征在于，还包括：根据所述MFCC特征矩阵和多个辅助信息采用所述tensorflow框架进行训练得到音频辅助识别预测模型；当所述监控音频数据的场景信息满足预设敏感场景规则时，使用所述音频辅助识别预测模型对所述监控音频数据进行预测得到所述监控音频数据的辅助识别信息；其中，所述标注信息还包括与所述多个音频样本文件对应的所述多个辅助信息。4.根据权利要求3所述的音频数据的监控处理方法，所述多个辅助信息包括对应所述多个音频样本文件的多个生成时间、对应所述多个音频样本文件中多个人声性别信息、多个声纹特征信息和对应所述多个音频样本文件的多个情绪信息。5.根据权利要求1所述的音频数据的监控处理方法，其特征在于，所述预处理包括降噪、滤波、声道转换以及类型转换中的至少一种。6.一种音频数据的监控处理系统，其特征在于，包括：获取模块，用于获取多个音频样本文件和监控音频数据，并获取所...

【专利技术属性】
技术研发人员：程荣，赵友林，
申请(专利权)人：上海声构信息科技有限公司，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人