【技术实现步骤摘要】
一种基于特定领域的语音打分模型构建系统及方法
[0001]本专利技术涉及语音分析处理
,具体为一种基于特定领域的语音打分模型构建系统及方法。
技术介绍
[0002]坐席员主要是指公司企业中在呼叫中心或客服部门工作,主要工作内容为通过接听电话或者外拨电话来处理服务、销售、数据采集、信息调查、业务回访等事务。此类工作人员均被称为坐席员。
[0003]现有的语音处理系统,存在不能对坐席员的语音进行分配,合理的对坐席员语音进行分析评估,便于让坐席熟悉并能够背诵标准话术的说法,限定文本的问题。
技术实现思路
[0004]本专利技术的目的就在于为了解决的是在培训过程中,通过对坐席沟通过程的语音进行打分,从而准确的评估坐席对话术的掌握程度的问题,而提出一种基于特定领域的语音打分模型构建系统及方法。
[0005]本专利技术的目的可以通过以下技术方案实现:一种基于特定领域的语音打分模型构建系统,包括测试采集模块、服务器、数据分析模块和模型构建模块;
[0006]所述测试采集模块用于采集在特定领域下测试的语音并将语音发送至服务器内;其中,特定领域测试的语音包括跟读场景下测试的语音及情景对练模式下测试的语音;
[0007]所述服务器将接收到的语音分配至对应工作人员电脑终端上,工作人员电脑终端内安装有数据分析模块;
[0008]所述数据分析模块用于分析特定领域下测试的语音得到评分维度,数据分析模块将分析的评分维度发送至模型构建模块;模型构建模块将接收到评分维度的时刻标记为分析完成 ...
【技术保护点】
【技术特征摘要】
1.一种基于特定领域的语音打分模型构建系统,其特征在于,包括测试采集模块、服务器、数据分析模块和模型构建模块;所述测试采集模块用于采集在特定领域下测试的语音并将语音发送至服务器内;其中,特定领域测试的语音包括跟读场景下测试的语音及情景对练模式下测试的语音;所述服务器将接收到的语音分配至对应工作人员电脑终端上,工作人员电脑终端内安装有数据分析模块;所述数据分析模块用于分析特定领域下测试的语音得到评分维度,数据分析模块将分析的评分维度发送至模型构建模块;模型构建模块将接收到评分维度的时刻标记为分析完成时刻;其中,数据分析模块分析包括内容相关性分析、表达流利性分析和场景流畅性分析;所述模型构建模块用于对评分维度进行模型构建,具体为:获取模型对应的评分维度,每个评分维度均对应一个预设分,将模型对应的评分维度与所有评分维度进行匹配获取得到对应的预设分,将模型匹配到的所有预设分进行求和得到总分;其中,评分维度包括关键词覆盖率、语义覆盖率、质检差错值、语量、字错率和停顿频率。2.根据权利要求1所述的一种基于特定领域的语音打分模型构建系统,其特征在于,所述跟读场景下测试的语音为应答者大声朗读测试提示中提示的所有内容的语音;客户回答与坐席回答一一对应;所述情景对练模式下测试的语音为限定某个场景下,坐席员按照指定的对话流程进行沟通的语音,当坐席员对话第一次偏离流程时,提示坐席员应该说话的关键信息;若在提示关键信息后,坐席员仍偏离流程,则对坐席员应该说的话进行完整信息提示;若第三次仍然未通过,则停止当前对话,结束流程。3.根据权利要求2所述的一种基于特定领域的语音打分模型构建系统,其特征在于,所述内容相关性分析包括关键词覆盖率计算、语义覆盖率计算、质检差错值计算和语量计算;所述关键词覆盖率计算的具体过程为:识别语音中出现关键词,将语音中出现关键词的数量与预设关键词数量进行比值计算得到关键词覆盖率KCR;取值范围为[0,1],具体表现为:给定一组关键词,关键词的数量为n个,采用语音关键词检索技术检索应答者答题语音中是否存在与其发音相同的词语,发音相同词语的数量m个,然后通过式子KCR=m/n获取得到关键词覆盖率KCR;所述语义覆盖率计算的具体过程为:对坐席员的语音进行语义标签标记,语义标签包括策略、施压类型、针对客户问题的回答、核身身份和三方转告;具体表现为:当某轮对话中坐席话术预先设置了A个语义标签时,而应答者回答的内容中监听了B个语义标签;则语义覆盖率KCS=A/B;所述质检差错值计算的具体过程为:将坐席员的语音转写为文本,将撰写的文本与质检数据库进行比对,质检数据库内包括若干个质检项;每个质检项均对应预设评分项;将文本与质检项进行比对,当文本匹配到对应的质检项,则将所有匹配到的质检项进行求和得到质检差错值;所述语量计算的的具体过程为:将坐席员的语音转换成文字并统计文字的字数得到语量。4.根据权利要求3所述的一种基于特定领域的语音打分模型构建系统,其特征在于,所述表达流利性分析包括发音标准分析、停顿分析和重复纠正分析;所述发音标准分析的具
体过程为:通过ASR对语音识别,统计ASR识别后的字错率;所述停顿分析的具体过程为:对坐席员的一段语音进行有填补性停顿识别,填补性停顿识别为嗯、啊、呢填充音出现的数量;同时统计一段语音中静音时长超过或等于0.3秒的次数;将填充音出现的数量加上静音时长超过或等于0.3秒的次数等于总停顿个数,利用公式停顿频率=总停顿个数/发音持续的总时间得到停顿频率;所述重复纠正分析的具体过程为:对语音中的单词、词组或句子进行识别,统计被重新说一遍且不对句法、词形或词序有所改动的单词、词组或句子的重复数量。5.根据权利要求4所述的一种基于特定领域的语音打分模型构建系统,其特征在于,所述模型构建模块进行模型构建的具体过程为:模型构建包括跟读场景评分模型构建和情景对练评分模型构建;其中场景评分模型构建为获取评分维度中的停顿频率,将停顿频率与所有评分维度进行匹配获取得到对应的预设分,将匹配到的预设分进行求和得到场景评分模型对应的总分;情景对练评分模型构建为获取评分维度中的关键词覆盖率、语...
【专利技术属性】
技术研发人员:吴亚洲,吴福全,王淋淋,
申请(专利权)人:安徽迪科数金科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。