The invention discloses a method of interrupting the conversation of intelligent voice robot based on VAD algorithm, which includes: users initiate voice communication through instant messaging module of web page interface, intelligent voice robot plays voice according to preset speech skill, voice activity detection module detects and judges whether users emit voice by VAD algorithm, and filters background voice and noise; Recognize the user's voice, interrupt the voice output of the intelligent voice robot and wait for the end of the user's speech; send the voice data of the user's speech to the real-time speech recognition module to recognize the content of the user's speech, and recognize the user's intention through the natural language understanding module; recognize the end of the user's speech, the intelligent voice robot chooses to switch the new speech node according to the change of the user's intention. Identify the user's intention unchanged and continue with the current session node. The invention solves the technical problem that the voice output of the intelligent voice robot can not be interrupted in real time and the voice technology can be switched in the communication between the user and the intelligent voice robot.
【技术实现步骤摘要】
一种基于VAD算法打断智能语音机器人对话的方法
本专利技术涉及智能语音对话领域,尤其涉及一种基于VAD算法打断智能语音机器人对话的方法。
技术介绍
随着计算机和人工智能技术的飞速发展,智能语音对话被广泛的开发和应用,智能机器人已经越来越多地走进了人们的生活和工作中,生活和工作中的机器人应用领域越来越广,智能机器人时代即将到来,并且大量在社会中广泛使用。目前,可以通过ASR(实时语音识别)与NLP(自然语言理解),实现机器实时理解人类声音语言,在客服、销售等场景进行AI智能沟通,对人类声音语言进行大规模语料训练,在指定场景下,可以得到识别质量较好的识别模型,机器人将人类的声音实时发送到ASR中进行识别,得到文本形式的识别结果,用于关键字匹配,或者语义处理,得到预设的问题与答案,在以音频形式播放出来,以匹配人与机器的语音沟通。虽然现有方案能支持机器人与人类的语言沟通,但是基本以人与机器人之间一问一答的形式为主,很难做到人类水平的插话交流,比较死板且不自然。针对访客的突然插话接入,机器人若无动于衷,显得不礼貌,交流不友好,用户必须听完完整的机器人预设话术,且在机器人话术输出的时段内无法打断或提出疑问,在沟通上难以实现及时、快捷;另一方面,访客的插话打断,可能有更迫切的问题询问,若不及时切换到相关问题节点上,会浪费客户时间。综上所述,现有智能语音机器人与人的语音交流方案在交互体验、沟通效率上仍有待提高。
技术实现思路
为了提高智能语音机器人的话术水平,实现用户随时打断智能语音机器人语音输出、智能语音机器人在沟通中切换话术的功能,本专利技术提出了一种基于VAD算法打断智 ...
【技术保护点】
1.一种基于VAD算法打断智能语音机器人对话的方法,其特征是,所述方法包括:S1、用户在网页界面通过网页即时通信模块发起语音交流,智能语音机器人按照预设话术进行语音播放;S2、智能语音机器人内的语音活动检测模块通过VAD算法实时检测判断用户是否发出声音,并过滤背景声音与噪音;S3、若语音活动检测模块识别用户发出声音,中断智能语音机器人的语音输出,等待用户发言结束;S4、智能语音机器人实时将用户发言音频数据发送至实时语音识别模块识别用户发言内容,并通过自然语言理解模块识别用户意图;S5、语音活动检测模块识别用户发言结束,智能语音机器人根据识别用户意图改变,选择切换新话术节点;识别用户意图未改变,继续当前话术节点。
【技术特征摘要】
1.一种基于VAD算法打断智能语音机器人对话的方法,其特征是,所述方法包括:S1、用户在网页界面通过网页即时通信模块发起语音交流,智能语音机器人按照预设话术进行语音播放;S2、智能语音机器人内的语音活动检测模块通过VAD算法实时检测判断用户是否发出声音,并过滤背景声音与噪音;S3、若语音活动检测模块识别用户发出声音,中断智能语音机器人的语音输出,等待用户发言结束;S4、智能语音机器人实时将用户发言音频数据发送至实时语音识别模块识别用户发言内容,并通过自然语言理解模块识别用户意图;S5、语音活动检测模块识别用户发言结束,智能语音机器人根据识别用户意图改变,选择切换新话术节点;识别用户意图未改变,继续当前话术节点。2.根据权利要求1所述的一种基于VAD算法打断智能语音机器人对话的方法...
【专利技术属性】
技术研发人员:刘鹏,孙传报,
申请(专利权)人:浙江百应科技有限公司,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。