语音交互方法、设备以及存储介质技术

技术编号:20007050 阅读:42 留言:0更新日期:2019-01-05 18:40
本实施例提供一种语音交互方法、设备以及存储介质,该方法包括:将获取到的用户的音频数据发送给服务器进行语意理解,得到结构化数据,并接收服务器返回的结构化数据,根据正在运行的游戏以及结构化数据控制游戏执行对应的操作,本实施例使用语音识别和语意理解技术,通过终端设备和服务器的通信实现用户在对话式交互下完成游戏的操作,增强了用户的游戏体验,提高了娱乐性和便利性。

Voice interaction methods, devices and storage media

The present embodiment provides a voice interaction method, device and storage medium. The method includes: sending the acquired user's audio data to the server for semantic understanding, obtaining structured data, receiving structured data returned by the server, performing corresponding operations according to the running game and structured data control game, and using speech recognition in this embodiment. And semantic understanding technology, through the communication between terminal equipment and server, users can complete the operation of the game under the dialogue interaction, enhance the user's game experience, improve entertainment and convenience.

【技术实现步骤摘要】
语音交互方法、设备以及存储介质
本专利技术实施例涉及语音交互
,尤其涉及一种语音交互方法、设备以及存储介质。
技术介绍
随着时代的发展,电视画面清晰度有了极大提升,优秀的解析度让电视在播放视频画面时,有了相当大的优势。电视不再是简单的看电视节目,已经发展为视频、娱乐、游戏、电视节目的平台。现有技术中,搭载度秘操作系统(DuerOperatingSystem,DuerOS)的电视机,集成了智能交互对话系统,用户可以用人类的语言自然的与智能电视进行交互。同时,电视机(Television,TV)端有大屏的特点,也非常适合游戏使用。然而,目前在电视场景中,通过遥控器按键玩游戏的体验并不好。一些更加适合对话式交互的游戏,在现有技术中的游戏体验不佳,娱乐性及便利性不能很好地满足用户需求。
技术实现思路
本专利技术实施例提供一种语音交互方法、设备以及存储介质,用于解决上述方案中互动效果不佳,用户体验和便利性较差的问题。第一方面,本专利技术实施例提供一种语音交互方法,包括:将获取到的用户的音频数据发送至服务器;接收所述服务器返回的结构化数据,所述结构化数据为所述服务器对所述音频数据进行识别后得到的;根据正在运行的游戏以及所述结构化数据控制所述游戏执行对应的操作。在一种具体的实现方式中,所述方法还包括:在检测到所述游戏启动时,建立所述游戏与语音智能交互系统之间的连接,完成所述游戏与所述语音智能交互系统之间的绑定。进一步地,所述将获取到的用户的音频数据发送至服务器,包括:通过所述语音智能交互系统,将所述音频数据发送给所述服务器进行语意理解。在一种具体的实现方式中,所述方法还包括:接收智能遥控器或者智能终端设备发送的用户输入的所述音频数据。进一步地,所述将获取到的用户的音频数据发送至服务器之前,所述方法还包括:对所述音频数据进行回声消除和/或降噪处理,得到处理后的音频数据。进一步地,根据正在运行的游戏以及所述结构化数据控制所述游戏执行对应的操作,包括:在所述语音智能交互系统中,根据当前正在运行的游戏以及所述结构化数据,确定所述结构化数据对应的操作指令;根据所述操作指令控制所述游戏执行对应的操作。第二方面,本专利技术实施例提供一种语音交互方法,包括:接收终端设备发送的音频数据;对所述音频数据进行语音理解处理,得到所述音频数据对应的结构化数据;将所述结构化数据返回所述终端设备。进一步地,所述对所述音频数据进行语意理解处理,得到所述音频数据对应的结构化数据,包括:对所述音频数据进行识别处理,得到所述音频数据对应的文字信息;对所述文字信息进行自然语言处理和语意解释,得到解析内容;通过模型处理将所述解析内容进行归类,得到所述结构化数据,所述结构化数据用于表示用户想表达的内容对应的机器指令信息。第三方面,本专利技术实施例提供一种终端设备,包括:发送模块,用于将获取到的用户的音频数据发送至服务器;接收模块,用于接收所述服务器返回的结构化数据,所述结构化数据为所述服务器对所述音频数据进行识别后得到的;处理模块,用于根据正在运行的游戏以及所述结构化数据控制所述游戏执行对应的操作。在一种具体的实现方式中,所述处理模块还用于:在检测到所述游戏启动时,建立所述游戏与语音智能交互系统之间的连接,完成所述游戏与所述语音智能交互系统之间的绑定。在一种具体的实现方式中,所述发送模块具体用于:通过所述语音智能交互系统,将所述音频数据发送给所述服务器进行语意理解。在一种具体的实现方式中,所述接收模块还用于:接收智能遥控器或者智能终端设备发送的用户输入的所述音频数据。在一种具体的实现方式中,所述处理模块具体用于:对所述音频数据进行回声消除和/或降噪处理,得到处理后的音频数据;将所述处理后的音频数据进行特征提取得到音频特征,并将所述音频特征进行解码,得到所述文字信息。在一种具体的实现方式中,所述处理模块具体用于:在所述语音智能交互系统中,根据当前正在运行的游戏以及所述结构化数据,确定所述结构化数据对应的操作指令;根据所述操作指令控制所述游戏执行对应的操作。第四方面,本专利技术实施例提供一种服务器,包括:接收模块,用于接收终端设备发送的音频数据;处理模块,用于对所述音频数据进行语音理解处理,得到所述音频数据对应的结构化数据;发送模块,用于将所述结构化数据返回所述终端设备。在一种具体的实现方式中,所述处理模块具体用于:对所述音频数据进行识别处理,得到所述音频数据对应的文字信息;对所述文字信息进行自然语言处理和语意解释,得到解析内容;通过模型处理将所述解析内容进行归类,得到所述结构化数据,所述结构化数据用于表示用户想表达的内容对应的机器指令信息。第五方面,本专利技术实施例提供一种终端设备,包括:接收器、发送器、处理器、存储器以及计算机程序;所述存储器存储计算机执行指令;所述处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如第一方面所述的语音交互方法。第六方面,本专利技术实施例提供一种服务器,包括:接收器、发送器、存储器、处理器以及计算机程序;所述存储器存储计算机执行指令;所述处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如第二方面所述的语音交互方法。第七方面,本专利技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如第一方面所述的语音交互方法。第八方面,本专利技术实施例提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如第二方面所述的语音交互方法。本实施例提供一种语音交互方法、设备以及存储介质,该方法包括:将获取到的用户的音频数据发送给服务器进行语意理解,得到结构化数据,并接收服务器返回的结构化数据,根据正在运行的游戏以及结构化数据控制游戏执行对应的操作,本实施例使用语音识别和语意理解技术,通过终端设备和服务器的通信实现用户在对话式交互下完成游戏的操作,增强了用户的游戏体验,提高了娱乐性和便利性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。图1为本专利技术实施例提供的语音交互方法的应用场景示意图;图2为本专利技术实施例提供的语音交互方法实施例一的交互流程图;图3为本专利技术实施例提供的语音交互方法实施例二的交互流程图;图4为本专利技术实施例提供的语音交互方法实施例三的交互流程图;图5为本专利技术实施例提供的语音交互方法实施例四的交互流程图;图6为本专利技术实施例提供的语音识别的流程图;图7为本专利技术实施例提供的语意理解的流程图;图8为本专利技术实施例提供的语音交互方法实施例五的示意图一;图9为本专利技术实施例提供的语音交互方法实施例五的示意图二;图10为本专利技术实施例提供的终端设备的结构示意图;图11为本专利技术实施例提供的服务器的结构示意图;图12为本专利技术实施例提供的终端设备的硬件结构示意图;图13为本专利技术实施例提供的服务器的硬件结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的本文档来自技高网...

【技术保护点】
1.一种语音交互方法,其特征在于,包括:将获取到的用户的音频数据发送至服务器;接收所述服务器返回的结构化数据,所述结构化数据为所述服务器对所述音频数据进行识别后得到的;根据正在运行的游戏以及所述结构化数据控制所述游戏执行对应的操作。

【技术特征摘要】
1.一种语音交互方法,其特征在于,包括:将获取到的用户的音频数据发送至服务器;接收所述服务器返回的结构化数据,所述结构化数据为所述服务器对所述音频数据进行识别后得到的;根据正在运行的游戏以及所述结构化数据控制所述游戏执行对应的操作。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:在检测到所述游戏启动时,建立所述游戏与语音智能交互系统之间的连接,完成所述游戏与所述语音智能交互系统之间的绑定。3.根据权利要求2所述的方法,其特征在于,所述将获取到的用户的音频数据发送至服务器,包括:通过所述语音智能交互系统,将所述音频数据发送给所述服务器进行语意理解。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:接收智能遥控器或者智能终端设备发送的用户输入的所述音频数据。5.根据权利要求1至4任一项所述的方法,其特征在于,所述将获取到的用户的音频数据发送至服务器之前,所述方法还包括:对所述音频数据进行回声消除和/或降噪处理,得到处理后的音频数据。6.根据权利要求2所述的方法,其特征在于,根据正在运行的游戏以及所述结构化数据控制所述游戏执行对应的操作,包括:在所述语音智能交互系统中,根据当前正在运行的游戏以及所述结构化数据,确定所述结构化数据对应的操作指令;根据所述操作指令控制所述游戏执行对应的操作。7.一种语音交互方法,其特征在于,包括:接收终端设备发送的音频数据;对所述音频数据进行语意理解处理,得到所述音频数据对应的结构化数据;将所述结构化数据返回所述终端设备。8.根据权利要求7所述的方法,其特征在于,所述对所述音频数据进行语意理解处理,得到所述音频数据对应的结构化数据,包括:对所述音频数据进行识别处理,得到所述音频数据对应的文字信息;对所述文字信息进行自然语言处理和语意解释,得到解析内容;通过模型处理将所述解析内容进行归类,得到所述结构化数据,所述结构化数据用于表示用户想表达的内容对应的机器指令信息。9.一种终端设备,其特征在于,包括:发送模块,用于将获取到的用户的音频数据发送至服务器;接收模块,用于接收所述服务器返回的结构化数据,所述结构化数据为所述服务器对所述音频数据进行识别后得到的;处理模块,用于根据正在运行的游戏以及所述结构化数据控制所述游戏执行对应的操作。10.根据权利要求9所述的设备,其特征在于,所述处理模块还用于:在检测到所述游戏...

【专利技术属性】
技术研发人员:杜滨源张岩袁鹏田龙龙常良玉
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1