一种基于特定领域的语音打分模型构建系统及方法技术方案

技术编号:28464062 阅读:20 留言:0更新日期:2021-05-15 21:29
本发明专利技术公开了一种基于特定领域的语音打分模型构建系统及方法,用于解决的是在培训过程中,通过对坐席沟通过程的语音进行打分,从而准确的评估坐席对话术的掌握程度的问题,包括测试采集模块、服务器、数据分析模块和模型构建模块;本发明专利技术服务器将采集到语音流文件调用语言识别引擎识别,并结合语音信号的特征,融合在一起进行分析处理,从而全方位的评估坐席对话术的掌握程度,以及坐席在沟通过程中的情感变化是否满足要求,通过评估,针对不同的分析结果,采取不同的培训手段进行干预,从而让坐席能够经过短时间的培训迅速掌握沟通的技能,提升新员工的产能。提升新员工的产能。提升新员工的产能。

【技术实现步骤摘要】
一种基于特定领域的语音打分模型构建系统及方法


[0001]本专利技术涉及语音分析处理
,具体为一种基于特定领域的语音打分模型构建系统及方法。

技术介绍

[0002]坐席员主要是指公司企业中在呼叫中心或客服部门工作,主要工作内容为通过接听电话或者外拨电话来处理服务、销售、数据采集、信息调查、业务回访等事务。此类工作人员均被称为坐席员。
[0003]现有的语音处理系统,存在不能对坐席员的语音进行分配,合理的对坐席员语音进行分析评估,便于让坐席熟悉并能够背诵标准话术的说法,限定文本的问题。

技术实现思路

[0004]本专利技术的目的就在于为了解决的是在培训过程中,通过对坐席沟通过程的语音进行打分,从而准确的评估坐席对话术的掌握程度的问题,而提出一种基于特定领域的语音打分模型构建系统及方法。
[0005]本专利技术的目的可以通过以下技术方案实现:一种基于特定领域的语音打分模型构建系统,包括测试采集模块、服务器、数据分析模块和模型构建模块;
[0006]所述测试采集模块用于采集在特定领域下测试的语音并将语音发送至服务器内;其中,特定领域测试的语音包括跟读场景下测试的语音及情景对练模式下测试的语音;
[0007]所述服务器将接收到的语音分配至对应工作人员电脑终端上,工作人员电脑终端内安装有数据分析模块;
[0008]所述数据分析模块用于分析特定领域下测试的语音得到评分维度,数据分析模块将分析的评分维度发送至模型构建模块;模型构建模块将接收到评分维度的时刻标记为分析完成时刻;其中,数据分析模块分析包括内容相关性分析、表达流利性分析和场景流畅性分析;
[0009]所述模型构建模块用于对评分维度进行模型构建,具体为:获取模型对应的评分维度,每个评分维度均对应一个预设分,将模型对应的评分维度与所有评分维度进行匹配获取得到对应的预设分,将模型匹配到的所有预设分进行求和得到总分;其中,评分维度包括关键词覆盖率、语义覆盖率、质检差错值、语量、字错率和停顿频率。
[0010]优选的,所述跟读场景下测试的语音为应答者大声朗读测试提示中提示的所有内容的语音;客户回答与坐席回答一一对应;所述情景对练模式下测试的语音为限定某个场景下,坐席员按照指定的对话流程进行沟通的语音,当坐席员对话第一次偏离流程时,提示坐席员应该说话的关键信息;若在提示关键信息后,坐席员仍偏离流程,则对坐席员应该说的话进行完整信息提示;若第三次仍然未通过,则停止当前对话,结束流程。
[0011]优选的,所述内容相关性分析包括关键词覆盖率计算、语义覆盖率计算、质检差错值计算和语量计算;
[0012]所述关键词覆盖率计算的具体过程为:识别语音中出现关键词,将语音中出现关键词的数量与预设关键词数量进行比值计算得到关键词覆盖率KCR;取值范围为[0,1],具体表现为:给定一组关键词,关键词的数量为n个,采用语音关键词检索技术检索应答者答题语音中是否存在与其发音相同的词语,发音相同词语的数量m个,然后通过式子KCR=m/n获取得到关键词覆盖率KCR;
[0013]所述语义覆盖率计算的具体过程为:对坐席员的语音进行语义标签标记,语义标签包括策略、施压类型、针对客户问题的回答、核身身份和三方转告;具体表现为:当某轮对话中坐席话术预先设置了A个语义标签时,而应答者回答的内容中监听了B个语义标签;则语义覆盖率KCS=A/B;
[0014]所述质检差错值计算的具体过程为:将坐席员的语音转写为文本,将撰写的文本与质检数据库进行比对,质检数据库内包括若干个质检项;每个质检项均对应预设评分项;将文本与质检项进行比对,当文本匹配到对应的质检项,则将所有匹配到的质检项进行求和得到质检差错值;
[0015]所述语量计算的的具体过程为:将坐席员的语音转换成文字并统计文字的字数得到语量;
[0016]所述相似度计算的具体过程为:将坐席员语音的文本与参考答案进行比对处理得到。
[0017]所述表达流利性分析包括发音标准分析、停顿分析和重复纠正分析;所述发音标准分析的具体过程为:通过ASR对语音识别,统计ASR识别后的字错率;
[0018]所述停顿分析的具体过程为:对坐席员的一段语音进行有填补性停顿识别,填补性停顿识别为嗯、啊、呢填充音出现的数量;同时统计一段语音中静音时长超过或等于0.3秒的次数;将填充音出现的数量加上静音时长超过或等于0.3秒的次数等于总停顿个数,利用公式停顿频率=总停顿个数/发音持续的总时间得到停顿频率;
[0019]所述重复纠正分析的具体过程为:对语音中的单词、词组或句子进行识别,统计被重新说一遍且不对句法、词形或词序有所改动的单词、词组或句子的重复数量。
[0020]优选的,所述模型构建模块进行模型构建的具体过程为:
[0021]模型构建包括跟读场景评分模型构建和情景对练评分模型构建;
[0022]其中场景评分模型构建为获取评分维度中的停顿频率、,将停顿频率、与所有评分维度进行匹配获取得到对应的预设分,将匹配到的预设分进行求和得到场景评分模型对应的总分;
[0023]情景对练评分模型构建为获取评分维度中的关键词覆盖率、语义覆盖率、质检差错值、语量和字错率,将关键词覆盖率、语义覆盖率、质检差错值、语量和字错率与所有评分维度进行匹配获取得到对应的预设分,将匹配到的预设分进行求和得到情景对练评分模型对应的总分。
[0024]优选的,还包括数据采集模块,所述数据采集模块用于采集工作人员电脑终端的终端信息并将终端信息发送至服务器内存储;其中终端信息包括电脑终端的型号、安装时刻、通电开始时刻、通电结束时刻和电脑终端的运行内存。
[0025]优选的,所述服务器将接收到的语音分配至对应工作人员电脑终端上的具体步骤为:
[0026]步骤一:将工作人员的电脑终端标记为初选终端,获取初选终端的终端信息,将初选终端的安装时刻与当前时刻进行时间差计算获取得到初选终端的安装时长并标记为F1,单位是天;将初选终端的通电开始时刻和通电结束时刻进行时间差计算获取得到单次通电时长,将初选终端的所有单次通电总时长进行求和得到工作总时长并标记为F2;
[0027]步骤二:将初选终端的运行内存标记为F3;将初选终端的安装时长、工作总时长、运行内存进行归一化处理并取其数值;
[0028]步骤三:利用公式获取得到初选终端的终端处理值FQ;其中,b1、b2、b3和b4均为预设比例系数,F4为初选终端的处效值;
[0029]步骤四:将终端处理值最大的初选终端标记为选中终端,服务器将接收到的语音分配至选中终端内,通过选中终端内的数据分析模块对语音进行分析处理,服务器将发送语音至选中终端的时刻标记为发送开始时刻;选中终端的处理次数增加一次;
[0030]步骤五:将发送开始时刻与分析完成时刻进行时间差计算获取得到单次处理时长;将单次处理时长与预设时长阈值进行比对,当单次处理时长小于预设时长阈值时,将预设时长阈值减去单次处理时长得到单次提前时长;将选中终端的所有本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于特定领域的语音打分模型构建系统,其特征在于,包括测试采集模块、服务器、数据分析模块和模型构建模块;所述测试采集模块用于采集在特定领域下测试的语音并将语音发送至服务器内;其中,特定领域测试的语音包括跟读场景下测试的语音及情景对练模式下测试的语音;所述服务器将接收到的语音分配至对应工作人员电脑终端上,工作人员电脑终端内安装有数据分析模块;所述数据分析模块用于分析特定领域下测试的语音得到评分维度,数据分析模块将分析的评分维度发送至模型构建模块;模型构建模块将接收到评分维度的时刻标记为分析完成时刻;其中,数据分析模块分析包括内容相关性分析、表达流利性分析和场景流畅性分析;所述模型构建模块用于对评分维度进行模型构建,具体为:获取模型对应的评分维度,每个评分维度均对应一个预设分,将模型对应的评分维度与所有评分维度进行匹配获取得到对应的预设分,将模型匹配到的所有预设分进行求和得到总分;其中,评分维度包括关键词覆盖率、语义覆盖率、质检差错值、语量、字错率和停顿频率。2.根据权利要求1所述的一种基于特定领域的语音打分模型构建系统,其特征在于,所述跟读场景下测试的语音为应答者大声朗读测试提示中提示的所有内容的语音;客户回答与坐席回答一一对应;所述情景对练模式下测试的语音为限定某个场景下,坐席员按照指定的对话流程进行沟通的语音,当坐席员对话第一次偏离流程时,提示坐席员应该说话的关键信息;若在提示关键信息后,坐席员仍偏离流程,则对坐席员应该说的话进行完整信息提示;若第三次仍然未通过,则停止当前对话,结束流程。3.根据权利要求2所述的一种基于特定领域的语音打分模型构建系统,其特征在于,所述内容相关性分析包括关键词覆盖率计算、语义覆盖率计算、质检差错值计算和语量计算;所述关键词覆盖率计算的具体过程为:识别语音中出现关键词,将语音中出现关键词的数量与预设关键词数量进行比值计算得到关键词覆盖率KCR;取值范围为[0,1],具体表现为:给定一组关键词,关键词的数量为n个,采用语音关键词检索技术检索应答者答题语音中是否存在与其发音相同的词语,发音相同词语的数量m个,然后通过式子KCR=m/n获取得到关键词覆盖率KCR;所述语义覆盖率计算的具体过程为:对坐席员的语音进行语义标签标记,语义标签包括策略、施压类型、针对客户问题的回答、核身身份和三方转告;具体表现为:当某轮对话中坐席话术预先设置了A个语义标签时,而应答者回答的内容中监听了B个语义标签;则语义覆盖率KCS=A/B;所述质检差错值计算的具体过程为:将坐席员的语音转写为文本,将撰写的文本与质检数据库进行比对,质检数据库内包括若干个质检项;每个质检项均对应预设评分项;将文本与质检项进行比对,当文本匹配到对应的质检项,则将所有匹配到的质检项进行求和得到质检差错值;所述语量计算的的具体过程为:将坐席员的语音转换成文字并统计文字的字数得到语量。4.根据权利要求3所述的一种基于特定领域的语音打分模型构建系统,其特征在于,所述表达流利性分析包括发音标准分析、停顿分析和重复纠正分析;所述发音标准分析的具
体过程为:通过ASR对语音识别,统计ASR识别后的字错率;所述停顿分析的具体过程为:对坐席员的一段语音进行有填补性停顿识别,填补性停顿识别为嗯、啊、呢填充音出现的数量;同时统计一段语音中静音时长超过或等于0.3秒的次数;将填充音出现的数量加上静音时长超过或等于0.3秒的次数等于总停顿个数,利用公式停顿频率=总停顿个数/发音持续的总时间得到停顿频率;所述重复纠正分析的具体过程为:对语音中的单词、词组或句子进行识别,统计被重新说一遍且不对句法、词形或词序有所改动的单词、词组或句子的重复数量。5.根据权利要求4所述的一种基于特定领域的语音打分模型构建系统,其特征在于,所述模型构建模块进行模型构建的具体过程为:模型构建包括跟读场景评分模型构建和情景对练评分模型构建;其中场景评分模型构建为获取评分维度中的停顿频率,将停顿频率与所有评分维度进行匹配获取得到对应的预设分,将匹配到的预设分进行求和得到场景评分模型对应的总分;情景对练评分模型构建为获取评分维度中的关键词覆盖率、语...

【专利技术属性】
技术研发人员:吴亚洲吴福全王淋淋
申请(专利权)人:安徽迪科数金科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1