【技术实现步骤摘要】
会话场景中的语音识别方法、装置及设备
[0001]本申请涉及智能会话
,尤其是涉及到一种会话场景中的语音识别方法、装置及设备。
技术介绍
[0002]智能会话场景中,机器人客服可通过服务器或者智能会话设备等模拟客服等人员与真实用户的终端进行语音或者会话等信息的交互,在机器人客服和用户对话时,机器人需要识别用户说话的内容,以便明白用户意图。
[0003]相关技术在会话场景的语音识别过程中,当用户接通电话开始,会话系统建与实时语音识别系统建立连接,机器人客服开始与用户会话,并将用户的语音流数据发送到实时语音识别系统,实时语音系统异步返回识别到用户说话的内容,机器人客服根据识别结果继续和用户对话,直至用户挂断电话后,结束会话。
[0004]在上述语音识别过程中,无论用户是否说话,当用户接通电话时,就会与实时语音识别系统建立连接,发送语音流数据,使得每次建立语音通话连接都会存在耗时,产生短暂卡顿的情况,影响用户的会话体验,并且在建立语音通话连接后,长时间无效的语音数据被发送到实时语音识别系统,使得实时语音识别系
【技术保护点】
【技术特征摘要】
1.一种会话场景中的语音识别方法,其特征在于,包括:针对会话系统建立连接池,在所述连接池中存储与实时语音识别系统的连接;响应于会话场景中的语音识别指令,接收会话场景中用户的语音数据;针对所述语音数据进行语音活动检测,确定所述语音数据表征的用户说话状态;若所述用户说话状态为用户开始说话,则调用所述连接池中存储与实时语音识别系统的连接,使用所述连接将会话系统与实时语音识别系统进行绑定,向实时语音识别系统发送语音数据。2.根据权利要求1所述的方法,其特征在于,所述针对会话系统建立连接池,在所述连接池中存储与实时语音识别系统的连接,具体包括:获取会话系统在历史时间段与实时语音识别系统建立的连接数量峰值,针对会话系统建立连接池,所述会话系统启动时使用所述连接数量峰值在所述连接池中初始化与实时语音识别系统的连接;或针对会话系统建立连接池,所述会话系统接通会话时在所述连接池中初始化所述会话与实时语音识别系统的连接。3.根据权利要求1所述的方法,其特征在于,在所述针对会话系统建立连接池,在所述连接池中存储与实时语音识别系统的连接之后,所述方法还包括:根据所述连接池中连接对应的状态,更新所述连接的状态标识;具体若所述连接池中的连接处于调用状态,则将所述连接的状态标识更新为忙碌,若所述连接池中的连接处于非调用状态,则将所述连接的状态标识更新为空闲。4.根据权利要求3所述的方法,其特征在于,在所述根据所述连接池中连接对应的状态,更新所述连接的状态标识之后,所述方法还包括:在会话系统接通会话之后在实时语音系统中定义保持连接规则,使用所述保持连接规则维持所述连接池中存储与实时语音识别系统的连接;或针对所述连接池中处于空闲状态的连接,按照间隔预设时间向实时语音识别系统发送空语音,以维持所述连接池中存储与实时语音识别系统的连接;在所述按照间隔预设时间向实时语音识别系统发送空语音,以维持所述连接池中存储与实时语音识别系统的连接之后,所述方法还包括:针对所述连接池中处于空闲状态的连接,若检测到所述处于空闲状态的连接持续向实时语音识别系统发送空语音的累计时间达到设定时间阈值,则关闭所述连接池中处于空闲状态的连接。5.根据权利要求1所述的方法,其特征在于,所述针对所述语音数据进行语音活动检测,确定所述语音数据表征的用户说话状态,具体包括:采用功率法针对所述语音数据进行语音活动检测,获取语音数据中每个采样点的功率值;根据所述每个采样点的功率值计算每帧语音数据对应的平均功率值;根据所述每帧语音数据对应的平均功率值,确定所述语音数据对应的声音状态,具体若所述每帧...
【专利技术属性】
技术研发人员:张森,余文虎,沈鹏,胡尧,周晓波,黄明星,
申请(专利权)人:北京水滴科技集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。