语音交互、语音处理方法、装置和系统制造方法及图纸

技术编号:20366619 阅读:18 留言:0更新日期:2019-02-16 18:14
本申请实施例公开了语音交互、语音处理方法、装置和系统。语音交互方法的一具体实施方式包括:响应于接收到用户发送的语音唤醒信息,接收用户发送的语音指令信息;向服务器发送语音指令信息,以及接收服务器返回的推送信息和推送信息包含的情绪信息;基于推送信息包含的情绪信息向用户反馈推送信息。该实施方式提供了一种新的语音交互方式,使语音交互方式更加丰富多样。并且,该语音交互方式基于推送信息包含的情绪信息向用户反馈推送信息,实现了个性化的信息反馈。

【技术实现步骤摘要】
语音交互、语音处理方法、装置和系统
本申请涉及通信
,具体涉及语音交互、语音处理方法、装置和系统。
技术介绍
随着计算机技术的普及,当今人们的生活已经逐渐走入智能时代。不仅仅是手机,计算机,平板电脑,人们的衣食住行的方方面面都开始应用出现不久的智能技术,智能电视,智能导航,智能家居等等,智能技术将在人们生活的各个方面提供方便快捷的服务。智能语音交互是基于语音输入的新一代交互模式,通过说话就可以得到反馈结果。然而,在现有语音交互方式中,与智能设备进行交互时,通常以文本形式进行信息反馈,信息反馈方式单一。
技术实现思路
本申请实施例提出了语音交互、语音处理方法、装置和系统。第一方面,本申请实施例提供了一种语音交互方法,应用于智能设备,包括:响应于接收到用户发送的语音唤醒信息,接收用户发送的语音指令信息;向服务器发送语音指令信息,以及接收服务器返回的推送信息和推送信息包含的情绪信息;基于推送信息包含的情绪信息向用户反馈推送信息。在一些实施例中,在接收用户发送的语音指令信息之前,还包括:展示预设虚拟形象的第一影像信息,以及播放唤醒交互语,其中,第一影像信息表征预设虚拟形象处于唤醒状态。在一些实施例中,在接收用户发送的语音指令信息时,还包括:展示预设虚拟形象的第二影像信息,其中,第二影像信息表征预设虚拟形象处于倾听状态。在一些实施例中,在接收服务器返回的推送信息和推送信息包含的情绪信息之前,还包括:接收服务器返回的语音指令信息对应的文本指令信息包含的情绪信息和文本指令信息包含的情绪信息对应的情绪交互语;展示预设虚拟形象的第三影像信息,以及播放情绪交互语,其中,第三影像信息表征预设虚拟形象表达文本指令信息包含的情绪信息对应的情绪。在一些实施例中,基于推送信息包含的情绪信息向用户反馈推送信息,包括:在第一预设区域显示推送信息,和/或以推送信息包含的情绪信息对应的语调播放推送信息,以及在第二预设区域展示预设虚拟形象的第四影像信息,其中,第四影像信息表征预设虚拟形象表达推送信息包含的情绪信息对应的情绪。在一些实施例中,在向服务器发送语音指令信息之前,还包括:对语音指令信息进行预设处理,其中,预设处理包括以下至少一项:语音检测、去噪、去混响、波束形成。第二方面,本申请实施例提供了一种语音处理方法,应用于服务器,包括:接收智能设备发送的语音指令信息;对语音指令信息进行语音识别,得到语音指令信息对应的文本指令信息;确定文本指令信息对应的推送信息,以及确定推送信息包含的情绪信息;将推送信息和推送信息包含的情绪信息发送给智能设备。在一些实施例中,在对语音指令信息进行语音识别,得到语音指令信息对应的文本指令信息之后,还包括:确定文本指令信息包含的情绪信息,以及确定文本指令信息包含的情绪信息对应的情绪交互语;将文本指令信息包含的情绪信息和文本指令信息包含的情绪信息对应的情绪交互语发送给智能设备。在一些实施例中,确定文本指令信息对应的推送信息,以及确定推送信息包含的情绪信息,包括:对文本指令信息进行大数据分析,得到文本指令信息对应的推送信息;将推送信息输入至预先训练的情绪识别模型,得到推送信息包含的情绪信息,其中,情绪识别模型用于识别信息包含的情绪信息;以及确定文本指令信息包含的情绪信息,以及确定文本指令信息包含的情绪信息对应的情绪交互语,包括:将文本指令信息输入至情绪识别模型,得到文本指令信息包含的情绪信息;对文本指令信息进行大数据分析,得到文本指令信息包含的情绪信息对应的情绪交互语。第三方面,本申请实施例提供了一种语音交互装置,设置于智能设备,包括:第一接收单元,被配置成响应于接收到用户发送的语音唤醒信息,接收用户发送的语音指令信息;第二接收单元,被配置成向服务器发送语音指令信息,以及接收服务器返回的推送信息和推送信息包含的情绪信息;反馈单元,被配置成基于推送信息包含的情绪信息向用户反馈推送信息。在一些实施例中,语音交互装置还包括:第一展示单元,被配置成展示预设虚拟形象的第一影像信息,以及播放唤醒交互语,其中,第一影像信息表征预设虚拟形象处于唤醒状态。在一些实施例中,语音交互装置还包括:第二展示单元,被配置成展示预设虚拟形象的第二影像信息,其中,第二影像信息表征预设虚拟形象处于倾听状态。在一些实施例中,语音交互装置还包括:第三接收单元,被配置成接收服务器返回的语音指令信息对应的文本指令信息包含的情绪信息和文本指令信息包含的情绪信息对应的情绪交互语;第三展示单元,被配置成展示预设虚拟形象的第三影像信息,以及播放情绪交互语,其中,第三影像信息表征预设虚拟形象表达文本指令信息包含的情绪信息对应的情绪。在一些实施例中,反馈单元进一步被配置成:在第一预设区域显示推送信息,和/或以推送信息包含的情绪信息对应的语调播放推送信息,以及在第二预设区域展示预设虚拟形象的第四影像信息,其中,第四影像信息表征预设虚拟形象表达推送信息包含的情绪信息对应的情绪。在一些实施例中,语音交互装置还包括:处理单元,被配置成对语音指令信息进行预设处理,其中,预设处理包括以下至少一项:语音检测、去噪、去混响、波束形成。第四方面,本申请实施例提供了一种语音处理装置,设置于服务器,包括:接收单元,被配置成接收智能设备发送的语音指令信息;识别单元,被配置成对语音指令信息进行语音识别,得到语音指令信息对应的文本指令信息;第一确定单元,被配置成确定文本指令信息对应的推送信息,以及确定推送信息包含的情绪信息;第一发送单元,被配置成将推送信息和推送信息包含的情绪信息发送给智能设备。在一些实施例中,语音处理装置还包括:第二确定单元,被配置成确定文本指令信息包含的情绪信息,以及确定文本指令信息包含的情绪信息对应的情绪交互语;第二发送单元,被配置成将文本指令信息包含的情绪信息和文本指令信息包含的情绪信息对应的情绪交互语发送给智能设备。在一些实施例中,第一确定单元进一步被配置成:对文本指令信息进行大数据分析,得到文本指令信息对应的推送信息;将推送信息输入至预先训练的情绪识别模型,得到推送信息包含的情绪信息,其中,情绪识别模型用于识别信息包含的情绪信息;以及第二确定单元进一步被配置成:将文本指令信息输入至情绪识别模型,得到文本指令信息包含的情绪信息;对文本指令信息进行大数据分析,得到文本指令信息包含的情绪信息对应的情绪交互语。第五方面,本申请实施例提供了一种语音交互系统,包括:智能设备和服务器;智能设备,用于响应于接收到用户发送的语音唤醒信息,接收用户发送的语音指令信息,向服务器发送语音指令信息;服务器,用于对语音指令信息进行语音识别,得到语音指令信息对应的文本指令信息,确定文本指令信息对应的推送信息,以及确定推送信息包含的情绪信息,将推送信息和推送信息包含的情绪信息发送给智能设备;智能设备,还用于基于推送信息包含的情绪信息向用户反馈推送信息。第六方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法或者实现如第二方面中任一实现方式描述的方法。第七方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行本文档来自技高网...

【技术保护点】
1.一种语音交互方法,应用于智能设备,包括:响应于接收到用户发送的语音唤醒信息,接收所述用户发送的语音指令信息;向服务器发送所述语音指令信息,以及接收所述服务器返回的推送信息和所述推送信息包含的情绪信息;基于所述推送信息包含的情绪信息向所述用户反馈所述推送信息。

【技术特征摘要】
1.一种语音交互方法,应用于智能设备,包括:响应于接收到用户发送的语音唤醒信息,接收所述用户发送的语音指令信息;向服务器发送所述语音指令信息,以及接收所述服务器返回的推送信息和所述推送信息包含的情绪信息;基于所述推送信息包含的情绪信息向所述用户反馈所述推送信息。2.根据权利要求1所述的方法,其中,在所述接收用户发送的语音指令信息之前,还包括:展示预设虚拟形象的第一影像信息,以及播放唤醒交互语,其中,所述第一影像信息表征所述预设虚拟形象处于唤醒状态。3.根据权利要求2所述的方法,其中,在所述接收用户发送的语音指令信息时,还包括:展示所述预设虚拟形象的第二影像信息,其中,所述第二影像信息表征所述预设虚拟形象处于倾听状态。4.根据权利要求3所述的方法,其中,在所述接收所述服务器返回的推送信息和所述推送信息包含的情绪信息之前,还包括:接收所述服务器返回的所述语音指令信息对应的文本指令信息包含的情绪信息和所述文本指令信息包含的情绪信息对应的情绪交互语;展示所述预设虚拟形象的第三影像信息,以及播放所述情绪交互语,其中,所述第三影像信息表征所述预设虚拟形象表达所述文本指令信息包含的情绪信息对应的情绪。5.根据权利要求4所述的方法,其中,所述基于所述推送信息包含的情绪信息向所述用户反馈所述推送信息,包括:在第一预设区域显示所述推送信息,和/或以所述推送信息包含的情绪信息对应的语调播放所述推送信息,以及在第二预设区域展示所述预设虚拟形象的第四影像信息,其中,所述第四影像信息表征所述预设虚拟形象表达所述推送信息包含的情绪信息对应的情绪。6.根据权利要求1-5之一所述的方法,其中,在所述向服务器发送所述语音指令信息之前,还包括:对所述语音指令信息进行预设处理,其中,所述预设处理包括以下至少一项:语音检测、去噪、去混响、波束形成。7.一种语音处理方法,应用于服务器,包括:接收智能设备发送的语音指令信息;对所述语音指令信息进行语音识别,得到所述语音指令信息对应的文本指令信息;确定所述文本指令信息对应的推送信息,以及确定所述推送信息包含的情绪信息;将所述推送信息和所述推送信息包含的情绪信息发送给所述智能设备。8.根据权利要求7所述的方法,其中,在所述对所述语音指令信息进行语音识别,得到所述语音指令信息对应的文本指令信息之后,还包括:确定所述文本指令信息包含的情绪信息,以及确定所述文本指令信息包含的情绪信息对应的情绪交互语;将所述文本指令信息包含的情绪信息和所述文本指令信息包含的情绪信息对应的情绪交互语发送给所述智能设...

【专利技术属性】
技术研发人员:王国伟徐银辉曹娟
申请(专利权)人:三星电子中国研发中心三星电子株式会社
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1