语音通话的质检方法、系统、设备及存储介质技术方案

技术编号:27689339 阅读:18 留言:0更新日期:2021-03-17 04:24
本发明专利技术公开了一种语音通话的质检方法、系统、设备和存储介质,所述语音通话的质检方法包括:基于QMQ机制实时接收语音通话数据;对所述语音通话数据进行自动语音识别处理,以得到对应的转写文本;基于所述转写文本进行质检处理。本发明专利技术通过在语音识别架构中引入了异步带同步的QMQ机制确保了语音通话数据获得过程的稳定性,并通过对语音通话数据进行自动语音识别处理得到对应的转写文本,基于转写文本完成质检处理,从而解决了语音通话质检效率较低、实时性不够和成本较高的问题。

【技术实现步骤摘要】
语音通话的质检方法、系统、设备及存储介质
本专利技术涉及语音识别
,尤其涉及一种语音通话的质检方法、系统、设备和存储介质。
技术介绍
当前,OTA(OnlineTravelAgency,在线旅行社)行业有大量的人工电话客服,对于判断在与目标酒店或者客人进行语音通话时电话客服是否存在违规或者非正常的话术行为,如谩骂、嘲讽、推诿、过渡承诺等,需要一套针对语音通话的质检系统用来规范客服人员的行为,进而提升客户服务的质量。传统的语音质检系统,一是通过质检员随机听取一定比例的电话录音进行检查,这种方式听取的电话数量有限,录音抽检的覆盖率低,目前每个员工一天约听3小时的录音通话且要记录抽检内容,效率较低;且人工听取的主观性带来质检标准不一的问题,有较多风险信息难以发现,质检成本也相对较高。另一种是延迟式智能语音质检,但该质检平台需要在一通电话完结后再对整通电话进行转写,对于每天多达50万通的通话录音,语音识别服务很难完成快速的转写并转送给质检平台,从而滞后了质检处理,影响了质检处理的效率,在遇到异常情况时介入时间较晚。综上,两种语音质检方式都存在各自的问题,导致用户体验较差。
技术实现思路
本专利技术要解决的技术问题是为了克服现有技术中OTA行业的语音通话质检存在处理效率较低、实时性差和成本较高的缺陷,提供一种能够在保证处理实时性的前提下提升语音通话质检效率并降低质检成本的语音通话的质检方法、系统、设备及存储介质。本专利技术是通过下述技术方案来解决上述技术问题:本专利技术提供了一种语音通话的质检方法,所述质检方法包括:基于QMQ(Q-MessageQuene,“去哪儿”消息队列组件)机制实时接收语音通话数据;对所述语音通话数据进行自动语音识别处理,以得到对应的转写文本;基于所述转写文本进行质检处理。较佳地,所述基于QMQ机制实时接收语音通话数据的步骤包括:生产者服务实时接收所述语音通话数据,并将所述语音通话数据的语音通话基础信息发送给QMQ消息中间件;消费者服务从所述QMQ消息中间件提取所述语音通话基础信息。较佳地,所述对所述语音通话数据进行自动语音识别处理,以得到对应的转写文本的步骤包括:通过所述语音通话基础信息调取对应的所述语音通话数据;使用音频识别模型将所述语音通话数据识别成对应的所述转写文本。较佳地,所述使用音频识别模型将所述语音通话数据识别成对应的所述转写文本的步骤包括:将所述语音通话数据按照包括的声道数拆分为对应数量的单通道数据;对所述单通道数据根据检测到的静音点进行切割,以获得语音通话单片数据;使用特征提取模型提取所述语音通话单片数据中的音频特征;将所述音频特征输入至声纹模型处理后转写出对应的所述转写文本。较佳地,所述对所述语音通话数据进行自动语音识别处理的步骤和所述基于所述转写文本进行质检处理的步骤之间还包括:对所述转写文本进行文本断句处理和/或文本顺滑处理。较佳地,所述语音通话基础信息包括语音标识符。较佳地,所述音频特征至少包括mfcc(MelFrequencyCepstrumCoefficient,梅尔频率倒谱系数)特征和pitch(一种在声学中反映音调的音频特征)特征。较佳地,所述将所述语音通话数据按照包括的声道数拆分为对应数量的单通道数据的步骤之前还包括:将所述语音通话数据进行解压缩处理,解压缩后的所述语音通话数据至少包括PCM(PulseCodeModulation,脉冲编码调制,一种可供后处理的音频格式)格式。较佳地,当所述语音通话数据为双声道时,将所述语音通话数据拆分为第一单通道数据和第二单通道数据;所述第一单通道数据用于表征用户录音,所述第二单通道数据用于表征客服录音。本专利技术还提供了一种语音通话的质检系统,所述质检系统包括:接收模块,用于基于QMQ机制实时接收语音通话数据;识别模块,用于对所述语音通话数据进行自动语音识别处理,以得到对应的转写文本;质检模块,用于基于所述转写文本进行质检处理。较佳地,所述接收模块包括:生产者服务单元,用于利用生产者服务实时接收所述语音通话数据,并将所述语音通话数据的语音通话基础信息发送给QMQ消息中间件;消费者服务单元,用于利用消费者服务从所述QMQ消息中间件提取所述语音通话基础信息。较佳地,所述识别模块包括:通话数据调取单元,用于通过所述语音通话基础信息调取对应的所述语音通话数据;通话数据识别单元,用于使用音频识别模型将所述语音通话数据识别成对应的所述转写文本。较佳地,所述通话数据识别单元包括:声道拆分子单元,用于将所述语音通话数据按照包括的声道数拆分为对应数量的单通道数据;音频切割子单元,用于对所述单通道数据根据检测到的静音点进行切割,以获得语音通话单片数据;特征提取子单元,用于使用特征提取模型提取所述语音通话单片数据中的音频特征;文本转写子单元,用于将所述音频特征输入至声纹模型处理后转写出对应的所述转写文本。较佳地,所述质检系统还包括文本处理模块,用于对所述转写文本进行文本断句处理和/或文本顺滑处理。较佳地,所述语音通话基础信息包括语音标识符。较佳地,所述音频特征至少包括mfcc特征和pitch特征。较佳地,所述通话数据识别单元还包括:解压缩子单元,用于将所述语音通话数据进行解压缩处理,解压缩后的所述语音通话数据至少包括PCM格式。较佳地,当所述语音通话数据为双声道时,所述声道拆分子单元用于将所述语音通话数据拆分为第一单通道数据和第二单通道数据;所述第一单通道数据用于表征用户录音,所述第二单通道数据用于表征客服录音。本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的语音通话的质检方法。本专利技术还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的语音通话的质检方法的步骤。本专利技术的积极进步效果在于:本专利技术提供了一种语音通话的质检方法、系统、设备及存储介质,与现有技术相比,本专利技术提供的语音通话的质检方法在语音识别架构中引入了异步带同步的QMQ机制确保了语音通话数据获得过程的稳定性,并通过对语音通话数据进行自动语音识别处理得到对应的转写文本,基于转写文本完成质检处理,从而解决了语音通话质检效率较低、实时性不够和成本较高的问题。附图说明图1为本专利技术的实施例1的语音通话的质检方法的流程图。图2为本专利技术的实施例1的语音通话的质检方法中步骤S1的流程图。图3为本专利技术的实施例1的语音通话的质检方法中步骤S2的流程图。图4为本专利技术的实施例1的语音通话的质检方法中步骤S22的流程图。图5为本专利技术的实施例2的语音通话的质检系统的模块整体示意图。图6为本专利技术的本文档来自技高网...

【技术保护点】
1.一种语音通话的质检方法,其特征在于,所述质检方法包括:/n基于QMQ机制实时接收语音通话数据;/n对所述语音通话数据进行自动语音识别处理,以得到对应的转写文本;/n基于所述转写文本进行质检处理。/n

【技术特征摘要】
1.一种语音通话的质检方法,其特征在于,所述质检方法包括:
基于QMQ机制实时接收语音通话数据;
对所述语音通话数据进行自动语音识别处理,以得到对应的转写文本;
基于所述转写文本进行质检处理。


2.如权利要求1所述的语音通话的质检方法,其特征在于,所述基于QMQ机制实时接收语音通话数据的步骤包括:
生产者服务实时接收所述语音通话数据,并将所述语音通话数据的语音通话基础信息发送给QMQ消息中间件;
消费者服务从所述QMQ消息中间件提取所述语音通话基础信息。


3.如权利要求2所述的语音通话的质检方法,其特征在于,所述对所述语音通话数据进行自动语音识别处理,以得到对应的转写文本的步骤包括:
通过所述语音通话基础信息调取对应的所述语音通话数据;
使用音频识别模型将所述语音通话数据识别成对应的所述转写文本。


4.如权利要求3所述的语音通话的质检方法,其特征在于,所述使用音频识别模型将所述语音通话数据识别成对应的所述转写文本的步骤包括:
将所述语音通话数据按照包括的声道数拆分为对应数量的单通道数据;
对所述单通道数据根据检测到的静音点进行切割,以获得语音通话单片数据;
使用特征提取模型提取所述语音通话单片数据中的音频特征;
将所述音频特征输入至声纹模型处理后转写出对应的所述转写文本。


5.如权利要求1所述的语音通话的质检方法,其特征在于,所述对所述语音通话数据进行自动语音识别处理的步骤和所述基于所述转写文本进行质检处理的步骤之间还包括:
对所述转写文本进行文本断句处理和/或文本顺滑处理。


6.一种语音通话的质检系统,其特征在于,所述质检系统包括:
接收模块,用于基于QMQ机制实时接收语音通话数据;
识别模块,用于对所述语音通话数据进行自动语音识别处理,以得到...

【专利技术属性】
技术研发人员:任君罗超胡泓李巍
申请(专利权)人:携程计算机技术上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1