音频处理方法、装置、存储介质及电子设备制造方法及图纸

技术编号：31482359 阅读：14 留言：0更新日期：2021-12-18 12:16

本公开提供了音频处理方法、装置、存储介质及电子设备，涉及机器学习和自然语言理解技术领域，进一步涉及音频技术和声纹识别技术领域。具体实现方案为：获取拨号事件对应的回铃音频；利用第一神经网络模型对回铃音频进行分类处理，确定回铃音频对应的第一分类结果，第一分类结果用于表示回铃音频归属的目标分类；当第一分类结果满足预设条件时，对回铃音频进行语音转写处理，得到待识别文本；利用第二神经网络模型对待识别文本进行分类处理，确定待识别文本对应的第二分类结果，第二分类结果用于表示待识别文本归属的目标分类；输出第二分类结果。本公开解决了客服沟通效率低、人力成本高的技术问题。本高的技术问题。本高的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】
音频处理方法、装置、存储介质及电子设备

[0001]本公开涉及机器学习和自然语言理解
，进一步涉及音频技术和声纹识别
，尤其涉及音频处理方法、装置、存储介质及电子设备。

技术介绍

[0002]银行、保险、运营商等领域的客服部门通常采用电话形式进行业务的沟通服务。每位客服人员每天需要拨打出大量电话，但是在这些拨出的电话中，实际被客户接通的电话为有效电话，而有效电话的数量基本不超过10％，其他未接通的电话均属于无效电话。拨打大量无效电话而产生的等待时间会极大程度上占据客服人员的工作时间。
[0003]针对上述的问题，目前尚未提出有效的解决方案。

技术实现思路

[0004]本公开提供了一种音频处理方法、装置、存储介质及电子设备，以至少解决客服沟通效率低、人力成本高的技术问题。
[0005]根据本公开的一方面，提供了一种音频处理方法，包括：获取拨号事件对应的回铃音频；利用第一神经网络模型对回铃音频进行分类处理，确定回铃音频对应的第一分类结果，第一分类结果用于表示回铃音频归属的目标分类；当第一分类结果满足预设条件时，对回铃音频进行语音转写处理，得到待识别文本；利用第二神经网络模型对待识别文本进行分类处理，确定待识别文本对应的第二分类结果，第二分类结果用于表示待识别文本归属的目标分类；输出第二分类结果。
[0006]根据本公开的又一方面，还提供了一种音频处理装置，包括：第一获取模块，用于获取拨号事件对应的回铃音频；第一分类模块，用于利用第一神经网络模型对回铃音频进行分类处理，确...

【技术保护点】

【技术特征摘要】
1.一种音频处理方法，包括：获取拨号事件对应的回铃音频；利用第一神经网络模型对所述回铃音频进行分类处理，确定所述回铃音频对应的第一分类结果，所述第一分类结果用于表示所述回铃音频归属的目标分类；当所述第一分类结果满足预设条件时，对所述回铃音频进行语音转写处理，得到待识别文本；利用第二神经网络模型对所述待识别文本进行分类处理，确定所述待识别文本对应的第二分类结果，所述第二分类结果用于表示所述待识别文本归属的目标分类；输出所述第二分类结果。2.根据权利要求1所述的音频处理方法，其中，所述输出所述第二分类结果包括：向业务系统上报所述第二分类结果，以使所述业务系统基于所述第二分类结果确定所述拨号事件的话务处理方式。3.根据权利要求1所述的音频处理方法，所述方法还包括：获取多组第一数据，其中，所述多组第一数据中的每组数据均包括：待训练回铃音频和所述待训练回铃音频归属的分类；对所述多组第一数据进行预处理，获取处理结果，其中，所述预处理包括以下至少之一：静音检测，噪声消除；对所述处理结果进行特征提取，获取音频特征参数；基于所述音频特征参数训练得到所述第一神经网络模型。4.根据权利要求1所述的音频处理方法，其中，对所述回铃音频进行语音转写处理，得到所述待识别文本，包括：利用语音识别系统对所述回铃音频进行语音转写处理，得到所述待识别文本；或者，利用端到端识别系统对所述回铃音频进行语音转写处理，得到所述待识别文本。5.根据权利要求1所述的音频处理方法，所述方法还包括：获取多组第二数据，其中，所述多组第二数据中的每组数据均包括：待训练文本和所述待训练文本归属的分类；基于所述待训练文本归属的分类对所述待训练文本进行分类，得到分类后文本；对所述分类后文本进行分词提取处理，得到分词结果；对所述分词结果进行词向量映射处理，得到词向量映射结果；基于所述词向量映射结果训练...

【专利技术属性】
技术研发人员：赵情恩，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人