一种客服坐席语音数据的质检方法和系统技术方案

技术编号:30967703 阅读:41 留言:0更新日期:2021-11-25 20:41
本发明专利技术公开了一种客服坐席语音数据的质检方法和系统,该方法包括:读取音频采样文件中的语音片段;对语音片段进行语音活动检测VAD处理确定待识别语音文件并记录未进行VAD处理的未处理时长,基于自动语音识别ASR对待识别语音文件进行识别获取目标文本;根据与待识别语音文件对应的第一总字节数、未处理时长、音频采样文件的每毫秒字节数确定目标文本的开始时间,并根据与语音片段对应的第二总字节数和每毫秒字节数的比值确定目标文本的结束时间;在语音通话结束后,根据用户发送的质检指令播放音频采样文件并基于开始时间和结束时间向用户显示目标文本,在基于音频进行质检时同步显示对应的文本,提高了客服坐席语音数据的质检效率。数据的质检效率。数据的质检效率。

【技术实现步骤摘要】
一种客服坐席语音数据的质检方法和系统


[0001]本申请涉及计算机
,更具体地,涉及一种客服坐席语音数据的质检方法和系统。

技术介绍

[0002]目前,呼叫中心已经成为企业提供线上综合业务信息的重要方式,呼叫中心的坐席根据企业的需求开展外呼或呼入的话务业务,以受理客户的意见反馈、咨询建议等业务,或针对企业的产品进行市场调查、电话销售、售后跟踪等业务。在呼叫中心开展上述话务业务的过程中,需要保证坐席与客户的通话内容的规范性和专业性,才能保证坐席所提供的话务服务的质量和效率,因此,对于所述通话内容的质检尤为重要。
[0003]现有技术中通常采用人工听取通话录音的方式来进行质检评定,并不能进行相应的文本展示,质检效率低。
[0004]因此,如何提高客服坐席语音数据的质检效率,是目前有待解决的技术问题。

技术实现思路

[0005]本专利技术提供一种客服坐席语音数据的质检方法,用以解决现有技术中客服坐席语音数据的质检效率低的技术问题。
[0006]该方法包括:
[0007]在语音通话的音频采样文件的未本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种客服坐席语音数据的质检方法,其特征在于,所述方法包括:在语音通话的音频采样文件的未读取字节数达到预设字节数时,基于所述未读取字节数读取语音片段,并记录所述语音片段的序号;对所述语音片段进行语音活动检测VAD处理确定待识别语音文件并记录未进行VAD处理的未处理时长,基于自动语音识别ASR对所述待识别语音文件进行识别获取目标文本;根据与所述待识别语音文件对应的第一总字节数、所述未处理时长、所述音频采样文件的每毫秒字节数确定所述目标文本的开始时间,并根据与所述语音片段对应的第二总字节数和所述每毫秒字节数的比值确定所述目标文本的结束时间;在所述语音通话结束后,根据用户发送的质检指令播放所述音频采样文件并基于所述开始时间和所述结束时间向用户显示所述目标文本;其中,所述第二总字节数是根据已读取片段数和所述预设字节数的乘积确定的,所述已读取片段数是根据所述序号确定的,所述第一总字节数是从所述第二总字节数中剔除与所述VAD处理对应的静默字节数后确定的。2.如权利要求1所述的方法,其特征在于,根据公式一确定所述开始时间,所述公式一为:其中,t1为所述开始时间,sn为所述第一总字节数,t为所述未处理时长,bn为所述每毫秒字节数。3.如权利要求2所述的方法,其特征在于,所述第一总字节数是根据公式二确定的,所述公式二为:sn=(s

sub)*b其中,s为所述已读取片段数,sub为与所述静默字节数对应的静默状态偏移量,b为所述预设字节数。4.如权利要求2所述的方法,其特征在于,t=te

ts其中,ts为未进行VAD处理的开始时间,te为未进行VAD处理的结束时间。5.如权利要求1所述的方法,其特征在于,所述方法还包括:在检测到所述语音通话时,根据所述语音通话的音频格式、预设采样率和预设采样位数对所述语音通话进行采样获取所述音频采样文件并存储。6.如权利要求5所述的方法,其特征在于,所述预设字节数据是根据所述音频格式确定的,所述预设字节数在所述音频格式为PCM时为第一字节数,所述预设字节数在所述音频格式为silk时为第二字节数。7.如权...

【专利技术属性】
技术研发人员:张帅
申请(专利权)人:南京优飞保科信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1