音频处理方法、装置、存储介质及电子设备制造方法及图纸

技术编号:31482359 阅读:14 留言:0更新日期:2021-12-18 12:16
本公开提供了音频处理方法、装置、存储介质及电子设备,涉及机器学习和自然语言理解技术领域,进一步涉及音频技术和声纹识别技术领域。具体实现方案为:获取拨号事件对应的回铃音频;利用第一神经网络模型对回铃音频进行分类处理,确定回铃音频对应的第一分类结果,第一分类结果用于表示回铃音频归属的目标分类;当第一分类结果满足预设条件时,对回铃音频进行语音转写处理,得到待识别文本;利用第二神经网络模型对待识别文本进行分类处理,确定待识别文本对应的第二分类结果,第二分类结果用于表示待识别文本归属的目标分类;输出第二分类结果。本公开解决了客服沟通效率低、人力成本高的技术问题。本高的技术问题。本高的技术问题。

【技术实现步骤摘要】
音频处理方法、装置、存储介质及电子设备


[0001]本公开涉及机器学习和自然语言理解
,进一步涉及音频技术和声纹识别
,尤其涉及音频处理方法、装置、存储介质及电子设备。

技术介绍

[0002]银行、保险、运营商等领域的客服部门通常采用电话形式进行业务的沟通服务。每位客服人员每天需要拨打出大量电话,但是在这些拨出的电话中,实际被客户接通的电话为有效电话,而有效电话的数量基本不超过10%,其他未接通的电话均属于无效电话。拨打大量无效电话而产生的等待时间会极大程度上占据客服人员的工作时间。
[0003]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0004]本公开提供了一种音频处理方法、装置、存储介质及电子设备,以至少解决客服沟通效率低、人力成本高的技术问题。
[0005]根据本公开的一方面,提供了一种音频处理方法,包括:获取拨号事件对应的回铃音频;利用第一神经网络模型对回铃音频进行分类处理,确定回铃音频对应的第一分类结果,第一分类结果用于表示回铃音频归属的目标分类;当第一分类结果满足预设条件时,对回铃音频进行语音转写处理,得到待识别文本;利用第二神经网络模型对待识别文本进行分类处理,确定待识别文本对应的第二分类结果,第二分类结果用于表示待识别文本归属的目标分类;输出第二分类结果。
[0006]根据本公开的又一方面,还提供了一种音频处理装置,包括:第一获取模块,用于获取拨号事件对应的回铃音频;第一分类模块,用于利用第一神经网络模型对回铃音频进行分类处理,确定回铃音频对应的第一分类结果,第一分类结果用于表示回铃音频归属的目标分类;语音转写模块,用于当第一分类结果满足预设条件时,对回铃音频进行语音转写处理,得到待识别文本;第二分类模块,用于利用第二神经网络模型对待识别文本进行分类处理,确定待识别文本对应的第二分类结果,第二分类结果用于表示待识别文本归属的目标分类;输出模块,用于输出第二分类结果。
[0007]根据本公开的又一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述任一项的音频处理方法。
[0008]根据本公开的又一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行根据上述任一项的音频处理方法。
[0009]根据本公开的又一方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现上述任一项的音频处理方法。
[0010]在本公开中,通过第一神经网络模型对回铃音频进行音频分类,确定第一分类结果,当第一分类结果满足预设条件时,将回铃音频进行语音转写获得待识别文本,利用第二
神经网络模型对待识别文本进行分类,确定第二分类结果,输出第二分类结果,达到了高效准确地检测回铃音频的目的,从而实现了减少拨号等待时间、提高客服沟通效率以及节约人力成本的技术效果,进而解决了客服沟通效率低、人力成本高的技术问题。
[0011]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0012]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0013]图1是根据本公开实施例的一种用于实现音频处理方法的计算机终端(或移动设备)的硬件结构框图;
[0014]图2是根据本公开实施例的一种音频处理方法的流程图;
[0015]图3是根据本公开实施例的一种训练第一神经网络模型的流程图;
[0016]图4是根据本公开实施例的一种训练第二神经网络模型的流程图;
[0017]图5是根据本公开实施例的一种音频处理装置的结构框图。
具体实施方式
[0018]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0019]需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0020]现有方案中,为减少客服人员等待业务电话接通的时间,采用的技术方案是:首先对电话拨号回铃音进行语音转文本处理,获得回铃音对应的文本,然后利用预设好的关键词对获得的文本进行匹配,最后按照关键词匹配结果对该业务电话进行处理。当获得的文本与预设的关键词匹配成功时,则判定该回铃音对应的业务电话为无效电话,按照处理无效电话的方式对该业务电话进行处理;当获得的文本与预设的关键词匹配不成功时,则判定该回铃音对应的业务电话为有效电话,将有效电话转接给对应的客服人员进行接通。
[0021]但是,上述方案中对于回铃音进行的语音转文本处理只能针对部分特定的回铃音有效,例如存在话音的回铃音,而针对不存在话音的回铃音,例如纯音乐、歌曲、忙音等,进行语音转文本处理后根本无法获取到回铃音对应的文本,且依然需要客服人员等待业务电话的接通。另外,现有方案在对获得的文本进行关键词匹配时,由于预设的关键词并不能灵活覆盖所有可能出现的文本信息,例如预设关键词的字数可能偏多、偏少,或者无法对相同、相近的文本进行词义转换,进而导致文本与关键词匹配时的准确率低下,可能将有效电
话误判为无效电话而进行处理,严重影响服务效果。
[0022]现有方案无法解决客服沟通效率低、人力成本高的技术问题。
[0023]根据本公开实施例,提供了一种音频处理方法,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0024]本公开实施例所提供的方法实施例可以在移动终端、计算机终端或者类似的电子设备中执行。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频处理方法,包括:获取拨号事件对应的回铃音频;利用第一神经网络模型对所述回铃音频进行分类处理,确定所述回铃音频对应的第一分类结果,所述第一分类结果用于表示所述回铃音频归属的目标分类;当所述第一分类结果满足预设条件时,对所述回铃音频进行语音转写处理,得到待识别文本;利用第二神经网络模型对所述待识别文本进行分类处理,确定所述待识别文本对应的第二分类结果,所述第二分类结果用于表示所述待识别文本归属的目标分类;输出所述第二分类结果。2.根据权利要求1所述的音频处理方法,其中,所述输出所述第二分类结果包括:向业务系统上报所述第二分类结果,以使所述业务系统基于所述第二分类结果确定所述拨号事件的话务处理方式。3.根据权利要求1所述的音频处理方法,所述方法还包括:获取多组第一数据,其中,所述多组第一数据中的每组数据均包括:待训练回铃音频和所述待训练回铃音频归属的分类;对所述多组第一数据进行预处理,获取处理结果,其中,所述预处理包括以下至少之一:静音检测,噪声消除;对所述处理结果进行特征提取,获取音频特征参数;基于所述音频特征参数训练得到所述第一神经网络模型。4.根据权利要求1所述的音频处理方法,其中,对所述回铃音频进行语音转写处理,得到所述待识别文本,包括:利用语音识别系统对所述回铃音频进行语音转写处理,得到所述待识别文本;或者,利用端到端识别系统对所述回铃音频进行语音转写处理,得到所述待识别文本。5.根据权利要求1所述的音频处理方法,所述方法还包括:获取多组第二数据,其中,所述多组第二数据中的每组数据均包括:待训练文本和所述待训练文本归属的分类;基于所述待训练文本归属的分类对所述待训练文本进行分类,得到分类后文本;对所述分类后文本进行分词提取处理,得到分词结果;对所述分词结果进行词向量映射处理,得到词向量映射结果;基于所述词向量映射结果训练...

【专利技术属性】
技术研发人员:赵情恩
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1