语速评估方法、系统、设备及存储介质技术方案

技术编号:27940106 阅读:17 留言:0更新日期:2021-04-02 14:21
本发明专利技术提供了一种语速评估方法、系统、设备及存储介质,该语速评估方法包括如下步骤:采集客服和用户会话过程中的流式语音流;从所述流式语音流中分离出客服语音流和用户语音流;分别计算所述客服语音流和所述用户语音流的语速获得客服语速和用户语速;计算所述客服语速与所述用户语速的语速比并将其作为语速评估指标。本发明专利技术的语速评估方法通过采集客服与用户会话过程中的流式语音流,实时获得客服与用户交互时单句的语速比,并将其作为客服与用户交互的语速评估指标,当语速比在一定阈值范围外时,系统可对客服的语速进行提醒和规范,从而提升客服服务过程中的用户体验。

【技术实现步骤摘要】
语速评估方法、系统、设备及存储介质
本专利技术涉及数据处理领域,具体地说,涉及一种语速评估方法、系统、设备及存储介质。
技术介绍
在线旅游(OnlineTravelAgency,OTA)行业中客服数量较多,每天都有50万通话数量,其中涉及客服数量上万人,为了能够更好地提升服务质量,更有效地解决用户的困难是非常重要的,因此,客服质检显得尤为重要。语速是评估客服对待用户态度的指标之一,也是规范客服服务的一个重要指标。当OTA客服与用户进行语音通话时,客服的语速影响着客人的服务体验,如出现客人与客服的语速相差较大,一般情况下该通话质量会受到质疑。当客人语速过快而客服语速较慢时,客服在解决用户需求时存在延迟或者服务的熟练程度较低;当客人语速较慢而客服语速过快时,可能客服急于完成通话会影响用户体验。目前,在OTA场景的基于语速评估的质检系统中,仍然没有一种能够完全的自动化、并及时地对存在语速对比过大行为的员工进行介入或者提醒的语速对比系统,目前,质检系统中语速评估模块基于两个评估流程,分别为基于人工听取评估和基于语音识别结果整通录音根据汉字比时长计算得出。人工听取评估,质检员工根据所需业务场景在质检平台抽取录音,员工听录音通话且要记录抽检内容再根据客人和客服语速对比给出类别结果,其工作效率较低,不同质检员的标准不一,有较多风险信息难以发现,同时对于公司来说质检成本较高,覆盖率低。汉字比时长算法则在会话结束后对会话录音采用语音识别算法等手段获得客服整体的语速,无法实现实时对客服语速的监测从而介入以提高服务质量的目的。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本专利技术的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
针对现有技术中的问题,本专利技术的目的在于提供了一种语速评估方法、系统、设备及存储介质,该语速评估方法通过实时监测客服与用户会话时的单句语速比,据此可对客服的语速进行提醒和规范,从而提升客服服务过程中的用户体验。本专利技术的一些实施例提供了一种语速评估方法,包括以下步骤:采集客服和用户会话过程中的流式语音流;从所述流式语音流中分离出客服语音流和用户语音流;分别计算所述客服语音流和所述用户语音流的语速获得客服语速和用户语速;计算所述客服语速与所述用户语速的语速比并将其作为语速评估指标。根据本专利技术的一些示例,所述分别计算一所述客服语音流和所述用户语音流的语速获得客服语速和用户语速包括如下步骤:分别将所述客服语音流和所述用户语音流转化为客服语音文本和用户语音文本;分别计算所述客服语音流和所述用户语音流的音频时长获得客服音频时长和用户音频时长;根据所述客服语音文本和所述客服音频时长获得所述客服语速;根据所述用户语音文本和所述用户音频时长获得所述用户语速。根据本专利技术的一些示例,所述分别计算所述客服语音流和所述用户语音流的音频时长获得客服音频时长和用户音频时长前,还包括如下步骤:分别去除所述客服语音流和所述用户语音流中的噪音块。根据本专利技术的一些示例,采用训练好的时延神经网络模型分别去除所述客服语音流和所述用户语音流中的噪音块。根据本专利技术的一些示例,采用训练好的时延神经网络模型分别去除所述客服语音流和所述用户语音流中的噪音块包括如下步骤:分别将所述客服语音流和所述用户语音流划分为包含N帧音频的I个第一音频块和J个第二音频块,其中,N、I和J为整数;分别将I个所述第一音频块和J个所述第二音频块输入时延神经网络模型,分别获得第i个所述第一音频块的第t帧为噪音帧的概率Pt和第j个所述第二音频块的第s帧为噪音帧的概率Ps;分别计算第i个所述第一音频块为噪音块的概率Pi和第j个所述第二音频块为噪音块的概率Pj,Pi和Pj分别为:其中,i∈[1,I],j∈[1,J],s∈[1,N],t∈[1,N]以及λ∈[0,1];判断Pi是否大于第一平滑阈值,如是,则从所述客服语音流中去除第i个所述第一音频块;判断Pj是否大于第二平滑阈值,如Pj大于第二平滑阈值,则从所述用户语音流中去除第j个所述第二音频块。根据本专利技术的一些示例,分别计算所述客服语音流和所述用户语音流的音频时长获得客服音频时长和用户音频时长还包括如下步骤:利用语音端点检测模型获得所述客服语音流中的客服语音出现端点和客服语音消失端点;计算所述客服语音出现端点和所述客服语音消失端点之间的音频的时长获得客服音频时长;利用语音端点检测模型获得所述用户语音流中的用户语音出现端点和用户语音消失端点;计算所述用户语音出现端点和所述用户语音消失端点之间的音频的时长获得用户音频时长。根据本专利技术的一些示例,所述语速评估方法还包括将所述语速评估指标发送给客服。根据本专利技术的一些示例,所述语速评估方法还包括如下步骤:判断所述语速比是否大于第一语速阈值或所述语速比是否小于第二语速阈值;如所述语速比大于第一语速阈值或所述语速比小于第二语速阈值,则向客服发送警示信息。本专利技术的一些实施例还提供了一种语速评估系统,用于实现所述的语速评估方法,其特征在于,包括语音采集模块、语音识别模块和计算模块,其中:所述语音采集模块用于持续采集客服和用户会话过程中的流式语音流;所述语音识别模块用于从所述流式语音流中分离出客服语音流和用户语音流;所述计算模块用于分别计算所述客服语音流和所述用户语音流的语速获得客服语速和用户语速;所述计算模块还用于计算所述客服语速与所述用户语速的语速比并将其作为语速评估指标。本专利技术的实施例还提供了一种电子设备,包括:处理器;存储器,其中存储有所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行所述语速评估方法的步骤。本专利技术的实施例还提供了一种计算机可读存储介质,用于存储程序,其特征在于,所述程序被执行时实现所述语速评估方法的步骤。本专利技术的语速评估方法通过采集客服与用户会话过程中的流式语音流,实时获得客服与用户交互时单句的语速比,并将其作为客服与用户交互的语速评估指标,当语速比在一定阈值范围外时,系统可对客服的语速进行提醒和规范,从而提升客服服务过程中的用户体验。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理,通过阅读参照以下附图对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显。显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一实施例的语速评估方法的流程图;图2为本专利技术一实施例的获得客服语速和用户语速的流程图;图3为本专利技术一实施例的去除客服语音流中的噪音块的流本文档来自技高网
...

【技术保护点】
1.一种语速评估方法,其特征在于,包括以下步骤:/n采集客服和用户会话过程中的流式语音流;/n从所述流式语音流中分离出客服语音流和用户语音流;/n分别计算所述客服语音流和所述用户语音流的语速获得客服语速和用户语速;/n计算所述客服语速与所述用户语速的语速比并将其作为语速评估指标。/n

【技术特征摘要】
1.一种语速评估方法,其特征在于,包括以下步骤:
采集客服和用户会话过程中的流式语音流;
从所述流式语音流中分离出客服语音流和用户语音流;
分别计算所述客服语音流和所述用户语音流的语速获得客服语速和用户语速;
计算所述客服语速与所述用户语速的语速比并将其作为语速评估指标。


2.根据权利要求1所述的语速评估方法,其特征在于,所述分别计算一所述客服语音流和所述用户语音流的语速获得客服语速和用户语速包括如下步骤:
分别将所述客服语音流和所述用户语音流转化为客服语音文本和用户语音文本;
分别计算所述客服语音流和所述用户语音流的音频时长获得客服音频时长和用户音频时长;
根据所述客服语音文本和所述客服音频时长获得所述客服语速;
根据所述用户语音文本和所述用户音频时长获得所述用户语速。


3.根据权利要求2所述的语速评估方法,其特征在于,所述分别计算所述客服语音流和所述用户语音流的音频时长获得客服音频时长和用户音频时长前,还包括如下步骤:
分别去除所述客服语音流和所述用户语音流中的噪音块。


4.根据权利要求3所述的语速评估方法,其特征在于,采用训练好的时延神经网络模型分别去除所述客服语音流和所述用户语音流中的噪音块。


5.根据权利要求4所述的语速评估方法,其特征在于,采用训练好的时延神经网络模型分别去除所述客服语音流和所述用户语音流中的噪音块包括如下步骤:
分别将所述客服语音流和所述用户语音流划分为包含N帧音频的I个第一音频块和J个第二音频块,其中,N、I和J为整数;
分别将I个所述第一音频块和J个所述第二音频块输入时延神经网络模型,分别获得第i个所述第一音频块的第t帧为噪音帧的概率Pt和第j个所述第二音频块的第s帧为噪音帧的概率Ps;
分别计算第i个所述第一音频块为噪音块的概率Pi和第j个所述第二音频块为噪音块的概率Pj,Pi和Pj分别为:






其中,i∈[1,I],j∈[1,J],s∈[1,N],t∈[1,N]以及λ∈[0,1];
判断Pi是否大于第一平滑阈值,如是,则从所述客服语音...

【专利技术属性】
技术研发人员:任君罗超邹宇李巍严丽
申请(专利权)人:携程旅游信息技术上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1