一种语音交互装置、方法和计算机可读存储介质制造方法及图纸

技术编号:23402007 阅读:21 留言:0更新日期:2020-02-22 14:04
本发明专利技术实施方式公开了一种语音交互装置、方法和计算机可读存储介质。装置包括:监听模块,用于监听用户会话中的语音数据和会话参数,将所述语音数据转换为文本数据;分析模块,用于分析所述文本数据以确定用户意图;控制模块,用于当基于所述用户意图确定具有介入需求且基于所述会话参数确定介入时机到达时,向用户发出基于所述用户意图确定的信息。本发明专利技术实施方式可以在适当的时间主动给出反馈内容,同时避免对用户造成干扰。

A voice interactive device, method and computer readable storage medium

【技术实现步骤摘要】
一种语音交互装置、方法和计算机可读存储介质
本专利技术涉及电子通信
,更具体的说,涉及一种语音交互装置、方法和计算机可读存储介质。
技术介绍
随着移动智能终端和云计算的快速发展,人工智能的浪潮正在悄然颠覆生活的点点滴滴,智能语音用户交互(VoiceUserInterface,VUI)作为一个新的领域也在快速发展,并对用户体验提出了更多关于语言学、情感塑造、逻辑搭建等方面的新要求。智能语音用户交互是基于语音输入的新一代交互模式,通过说话就可以得到反馈结果。典型的应用场景为语音助手。语音助手是一款智能型的应用,通过智能对话与即时问答的智能交互,实现帮忙用户解决问题,其主要是帮忙用户解决生活类问题。目前的智能语音交互中,通常是人类主动提供输入、机器被动提供反馈的循环模式。智能语音系统只会单一地服从用户指令。然而,这种被动机制无法实现自然的语音交互。比如,机械性的反馈不能够充分考虑到对话场景的需要,导致人机交互过程中机器显得“情商”太低,使用体验较差。
技术实现思路
本专利技术提出一种语音交互方法、装置和计算机本文档来自技高网...

【技术保护点】
1.一种语音交互装置,其特征在于,包括:/n监听模块,用于监听用户会话中的语音数据和会话参数,将所述语音数据转换为文本数据;/n分析模块,用于分析所述文本数据以确定用户意图;/n控制模块,用于当基于所述用户意图确定具有介入需求且基于所述会话参数确定介入时机到达时,向用户发出基于所述用户意图确定的信息。/n

【技术特征摘要】
1.一种语音交互装置,其特征在于,包括:
监听模块,用于监听用户会话中的语音数据和会话参数,将所述语音数据转换为文本数据;
分析模块,用于分析所述文本数据以确定用户意图;
控制模块,用于当基于所述用户意图确定具有介入需求且基于所述会话参数确定介入时机到达时,向用户发出基于所述用户意图确定的信息。


2.根据权利要求1所述的语音交互装置,其特征在于,所述会话参数包括下列中的至少一个:
会话中断时间;会话交流频率;会话人数;用户情绪参数;用户性格参数。


3.根据权利要求1所述的语音交互装置,其特征在于,所述会话参数包括会话中断时间和/或会话交流频率;
所述控制模块,用于当所述会话中断时间大于会话中断时间门限值和/或所述会话交流频率低于会话交流频率门限值时,确定介入时机到达。


4.根据权利要求3所述的语音交互装置,其特征在于,所述会话参数还包括会话人数、用户情绪参数或用户性格参数;
所述控制模块,还用于基于所述会话人数、用户情绪参数或用户性格参数调节所述会话中断时间门限值和/或所述会话交流频率门限值。


5.根据权利要求4所述的语音交互装置,其特征在于,
所述控制模块,用于执行下列中的至少一个:
当会话人数增加时,增加所述会话交流频率门限值且降低所述会话中断时间门限值;
当会话人数降低时,降低所述会话交流频率门限值且增加所述会话中断时间门限值;
当用户情绪参数指示用户开心时,增加所述会话交流频率门限值且降低所述会话中断时间门限值;
当用户情绪参数指示用户生气时,增加所述会话交流频率门限值且降低所述会话中断时间门限值;
当用户情绪参数指示用户害怕时,增加所述会话交流频率门限值且降低所述会话中断时间门限值;
当用户情绪参数指示用户难过时,降低所述会话交流频率门限值且增加所述会话中断时间门限值;
当用户性格参数指示用户健谈时,增加所述会话交流频率门限值且降低所述会话中断时间门限值;
当用户性格参数指示用户不健谈时,降低所述会话交流频率门限值且增加所述会话中断时间门限值;
当用户性格参数指示用户语速快时,增加所述会话交流频率门限值且降低所述会话中断时间门限值;
当用户性格参数指示用户语速慢时,降低所述会话交流频率门限值且增加所述会话中断时间门限值;
当会话人数大于预先设定的人数门限值时,将所述会话中断时间门限值设置为足以判定介入时机不到达的值;当会话人数大于预先设定的人数门限值时,将所述会话交流频率门限值设置为足以判定介入时机不到达的值;
当用户性格参数的等级为强烈时,将所述会话中断时间门限值设置为足以判定介入时机不到达的值;
当用户性格参数的等级为强烈时,将所述会话交流频率门限值设置为足以判定介入时机不到达的值;
当会话人数小于等于预先设定的人数门限值且用户性格参数的等级为通常时,计算用户性格参数、用户情绪参数和会话人数的加权值,基于所述加权值调整所述会话交流频率门限值;
当会话人数小于等于预先设定的人数门限值且用户性格参数的等级为通常时,计算用户性格参数、用户情绪参数和会话人数的加权值,基于所述加权值调整所述会话中断时间门限值。


6.根据权利要求3所述的语音交互装置,其特征在于,
分析模块,还用于基于所述语音数据和所述文本数据对会话进行场景分类;
其中所述控制模块,还用于基于场景分类结果,确定所述会话中断时间门限值和/或所述会话交流频率门限值,并基于所述场景分类结果判定是否基于会话人数、用户情绪参数或用户性格参数调节所述会话中断时间门限值和/或所述会话交流频率门限值。


7.根据权利要求6所述的语音交互装置,其特征在于,
分析模块,用于基于所述文本数据确定对话结构和话题关键词的固定性;基于所述语音数据的波形确定交互节奏;基于所述对话结构、话题关键词的固定性和交互节奏对会话进行场景分类。


8.根据权利要求7所述的语音交互装置,其特征在于,
所述场景分类为聊天类对话,所述控制模块,用于判定基于会话人数、用户情绪参数或用户性格参数调节所述会话中断时间门限值和/或所述会话交流频率门限值;或
所述场景分类为问答讨论类对话,所述控制模块,用于判定不基于会话人数、用户情绪参数或用户性格参数调节所述会话中断时间门限值和/或所述会话交流频率门限值;或
所述场景分类为固定对话程序类对话,所述控制模块,用于判定不基于会话人数、用户情绪参数或用户性格参数调节所述会话中断时间门限值和/或所述会话交流频率门限值。


9.根据权利要求1-8中任一项所述的语音交互装置,其特征在于,
监听模块,还用于基于所述语音数据的声纹特征标记用户,将所述语音数据和所述文本数据与识别出的用户相匹配。


10.根据权利要求1-8中任一项所述的语音交互装置,其特征在于,
所述监听模块、分析模块和控制模块,集成在单独实体中;或
所述监听模块部署在第一实体中,所述分析模块和所述控制模块部署在云端;或
所述监听模块和所述分析模块部署在第一实体中,所述控制模块部署在云端;或
所述监听模块和所述控制模块部署在第一实体中,所述分析模块部署在云端。


11...

【专利技术属性】
技术研发人员:王琨潘艳芳赵雅志丁琳姜悦悦范旭彭博
申请(专利权)人:三星电子中国研发中心三星电子株式会社
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1