一种音频检测方法、装置、设备及存储介质制造方法及图纸

技术编号：19861473 阅读：15 留言：0更新日期：2018-12-22 12:36

本发明专利技术实施例公开了一种音频检测方法、装置、设备及存储介质，涉及计算机网络技术领域。该音频检测方法包括：获取音频文件数据；确定音频文件数据对应的属性检测数据；通过预先训练的全连接网络模型，依据属性检测数据进行语音违规行为检测，生成音频文件数据对应的语音行为检测结果。本发明专利技术实施例能够及时检测出语音违规行为对应的违规语音数据，从而解决了现有基于用户举报和人工抽查导致语音违规行为检测的时间滞后的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种音频检测方法、装置、设备及存储介质
本专利技术涉及计算机网络
，尤其涉及一种音频检测方法、装置、设备及存储介质。
技术介绍
随着计算机网络技术的快速发展，诸如个人计算机(PersonalComputer，PC)、手机、平板电脑等设备越来越普及，给人们的生活、学习及工作带来了极大的便利。作为设备的一个具体应用，用户可以使用设备，通过网络与其他用户进行语音沟通，如可以使用设备中所安装的带有语音聊天功能的软件，通过网络与其他用户进行语音聊天，也可以通过加入特定聊天室或聊天群参与多人的语音聊天和娱乐。具体的，用户可以通过设备将其所需要发送的语音信息发送给网络，使得其他用户可以通过网络接收到该语音信息并播放，达到语音沟通的目的。在实际聊天环境中，尤其是多人聊天时，语音信息涉及的内容范围较广，其中可能包含令人不适的语音数据，诸如刺耳、高分贝、内容不恰当等，这些语音通常是由个别用户恶意发出旨在干扰其他用户的正常使用，因而软件运营方将这类语音列为违规语音数据。为了打击违规语音数据，保障用户的正常使用体验，避免用户流失而影响商业运营，软件运营方做了很多努力和探索，但收效有限。现有技术中，经常采用两种方案，一种是在软件上配置有举报入口，供正常用户举办违规用户，软件平台根据举报的线索作相应处理和惩罚；另一种是在平台侧部署人力，通过人工抽查或监控处理违规语音。对于具有大量活跃用户的软件平台，同一时间内经常同时并存数目极大的聊天室，各种违规语音数据很可能会大量随机出现，由此可知，上述两种方案均难以有效制止同一时间内随机出现的大量违规语音数据，也整体上很难解决违规语音影响用...

【技术保护点】
1.一种音频检测方法，其特征在于，包括：获取音频文件数据；确定所述音频文件数据对应的属性检测数据；通过预先训练的全连接网络模型，依据所述属性检测数据进行语音违规行为检测，生成所述音频文件数据对应的语音行为检测结果。

【技术特征摘要】
1.一种音频检测方法，其特征在于，包括：获取音频文件数据；确定所述音频文件数据对应的属性检测数据；通过预先训练的全连接网络模型，依据所述属性检测数据进行语音违规行为检测，生成所述音频文件数据对应的语音行为检测结果。2.根据权利要求1所述的方法，其特征在于，所述确定所述音频文件数据对应的属性检测数据，包括：对所述音频文件数据进行切片处理，得到至少两帧音频时域信息；依据所述至少两帧音频时域信息进行特征提取，得到振幅谱特征数据和声纹特征数据；对所述振幅谱特征数据和所述声纹特征数据进行拼接，生成特征向量数据；通过预先训练的语音分类模型，依据所述特征向量数据进行语音分类处理，得到作为所述属性检测数据的分类概率数据。3.根据权利要求2所述的方法，其特征在于，所述依据所述至少两帧音频时域信息进行特征提取，得到振幅谱特征数据，包括：对所述至少两帧音频时域信息进行频域变换，得到音频频域信息；基于所述音频频域信息进行振幅谱特征提取，得到所述振幅谱特征数据。4.根据权利要求1所述的方法，其特征在于，所述确定所述音频文件数据对应的属性检测数据，包括：对所述音频文件数据进行切片处理，得到至少两帧音频时域信息；对所述至少两帧音频时域信息进行频域变换，得到音频频域信息；对所述音频频域信息进行均值处理，得到第一定长数据；基于所述第一定长数据，通过预先训练的神经网络模型进行声纹特征提取，得到作为所述属性检测数据的声纹特征数据。5.根据权利要求4所述的方法，其特征在于，所述方法还包括：从预设的训练集中，获取待训练音频文件数据；采用预设的移动窗口，对所述待训练音频文件数据进行切片，得到帧时域信息；对所述帧时域信息进行频域变换，得到帧频域信息；对所述帧频域信息进行均值处理，得到第二定长数据；基于所述第二定长数据和所述音频文件数据对应的标签数据，按照预设的神经网络算法进行训练，得到所述神经网络模型。6.根据权利要求1所述的方法，其特征在于，还包括：获取目标用户的历史行为数据，其中，所述历史行为数据包括以下至少一项：历史登录数据、用户消费行为数据、违规历史数据和充值历史数据；根据所述历史行为数据得到作为所述属性检测数据的用户等级数据。7.根据权利要求1所述的方法，其特征在于，所述属性检测数据包括以下至少...

【专利技术属性】
技术研发人员：李振，黄震川，邹昱，
申请(专利权)人：广州市百果园信息技术有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人