智能设备、服务器及语音交互方法技术

技术编号:33156637 阅读:59 留言:0更新日期:2022-04-22 14:13
本申请实施例提供了一种智能设备、服务器及语音交互方法,其中,智能设备包括音频输入组件和控制器,控制器被配置为:接收用户输入的唤醒指令,根据所述唤醒指令,与服务器建立websocket连接;接收所述用户输入的语音流数据,在接收到的语音流数据达到预设的分片限值时,将所述语音流数据设置为语音分片数据,设置所述语音分片数据的分片参数;封装包含所述语音分片数据和分片参数的TLV数据包;向服务器发送所述TLV数据包,以使所述服务器对所述TLV数据包进行解析,得到响应数据;根据服务器反馈的响应数据进行响应。本申请实施例提高了语音交互效率,提升了语音交互体验。提升了语音交互体验。提升了语音交互体验。

【技术实现步骤摘要】
智能设备、服务器及语音交互方法


[0001]本申请涉及语音交互
,尤其涉及一种智能设备、服务器及语音交互方法。

技术介绍

[0002]现如今,随着越来越多的智能设备支持语音交互,语音交互逐渐成为一种越来越普及的交互方式。对于支持语音交互的智能设备,用户可通过发出语音指令的方式来对其进行控制。例如,通过语音指令控制智能设备调节音量、搜索资讯等等。语音交互分为在线语音交互与离线语音交互这两种实现方式,其中,在线语音交互方式能通过服务器对语音指令进行数据处理,能提高智能设备对语音指令的响应的准确性。为了方便与服务器进行多次数据交互,智能设备可与服务器建立长连接,从而不需要每次向服务器发送请求时都重新与服务器建立连接。相关技术中,智能设备与服务器建立的长连接是http长连接,然而,受限于http长连接的通信协议,智能设备每次向服务器请求数据时发送的http请求都需要携带请求头,在请求头中指明host(服务器域名和TCP端口号)、Content

Type(内容编码类型)、Accept

Encoding(接受的编码格式)、Connection(连接)、User

Agent(用户代理的字符串值)等信息,导致智能设备向服务器请求数据时的数据传输量较大,花费的时间较长,最终导致智能设备响应用户的速度较慢,影响了语音交互体验。

技术实现思路

[0003]为解决语音交互效率低的技术问题,本申请提供了一种智能设备、服务器及语音交互方法。
[0004]第一方面,本申请提供了一种智能设备,所述智能设备包括:
[0005]音频输入组件,用于接收用户音频,所述用户音频包括唤醒指令和语音流数据;控制器,分别与所述音频输入组件和音频输出组件连接,所述控制器被配置为:
[0006]接收用户输入的唤醒指令,根据所述唤醒指令,与服务器建立websocket连接;
[0007]接收所述用户输入的语音流数据,在所述语音流数据达到预设的分片限值时,将所述语音流数据设置为语音分片数据,设置所述语音分片数据的分片参数;
[0008]封装包含所述语音分片数据和分片参数的TLV数据包;
[0009]向服务器发送所述TLV数据包,以使所述服务器对所述TLV数据包进行解析,得到响应数据;
[0010]根据服务器反馈的响应数据进行响应。
[0011]在一些实施例中,封装包含所述语音分片数据和分片参数的TLV数据包,包括:
[0012]封装包含所述语音分片数据、分片参数和会话标识的TLV数据包,其中,所述会话标识与所述websocket连接相对应,用于将所述服务器反馈的包含所述会话标识的响应数据确定为所述TLV数据包的响应数据。
[0013]在一些实施例中,封装包含所述语音分片数据和分片参数的TLV数据包,包括:
[0014]按照所述数据类型、数据长度、数据内容的格式生成所述会话标识对应的TLV数
据。
[0015]在一些实施例中,封装包含所述语音分片数据和分片参数的TLV数据包,包括:
[0016]按照数据类型、数据长度、数据内容的格式生成所述语音分片数据对应的TLV数据;
[0017]按照所述数据类型、数据长度、数据内容的格式生成所述分片参数对应的TLV数据;
[0018]按照校验位、状态位、总数据长度的格式生成包头,其中,所述总数据长度为全部TLV数据中的数据长度的和值;
[0019]封装包含所述包头,以及包含全部TLV数据的包体的TLV数据包。
[0020]第二方面,本申请提供了一种服务器,该服务器被配置为:
[0021]接收智能设备发送的websocket连接请求,根据所述websocket连接请求与所述智能设备建立websocket连接;
[0022]接收智能设备发送的第一TLV数据包,解析所述第一TLV数据包,得到语音分片数据以及分片参数;
[0023]根据所述分片参数对所述语音分片数据进行语音处理,得到处理结果;
[0024]封装包含所述处理结果的第二TLV数据包,将所述第二TLV数据包作为响应数据反馈给所述智能设备,使所述智能设备根据所述语音识别结果进行响应。
[0025]第三方面,本申请提供了一种语音交互方法,用于智能设备,该方法包括:
[0026]接收用户输入的唤醒指令,根据所述唤醒指令,与服务器建立websocket连接;
[0027]接收所述用户输入的语音流数据,在接收到的语音流数据达到预设的分片限值时,将所述语音流数据设置为语音分片数据,设置所述语音分片数据的分片参数;
[0028]封装包含所述语音分片数据和分片参数的TLV数据包;
[0029]向服务器发送所述TLV数据包,以使所述服务器对所述TLV数据包进行解析,得到响应数据;
[0030]根据服务器反馈的响应数据进行响应。
[0031]第四方面,本申请提供了一种语音交互方法,用于服务器,该方法包括:
[0032]接收智能设备发送的websocket连接请求,根据所述websocket连接请求与所述显示设备建立websocket连接;
[0033]接收智能设备发送的第一TLV数据包,解析所述第一TLV数据包,得到语音分片数据以及分片参数;
[0034]根据所述分片参数对所述语音分片数据进行语音处理,得到处理结果;
[0035]封装包含所述处理结果的第二TLV数据包,将所述第二TLV数据包作为响应数据反馈给所述智能设备,使所述智能设备根据所述语音识别结果进行响应。
[0036]本申请提供的智能设备、服务器及流式数据的交互方法的有益效果包括:
[0037]本申请实施例通过将智能设备与服务器建立websocket连接,利用websocket连接场景下智能设备发送数据不需要发送请求头的优势,使得智能设备能快速将数据传输给服务器,提高了数据传输速率,进而提高了语音交互效率;利用自定义的TLV编码格式在智能设备和服务器之间进行数据传输,在一个TLV数据包可传输多项不同类型的数据,该TLV数据包支持动态扩展,可根据TLV数据包的总字节数,动态调整包头中length的字节数,能够
实现语音流数据的不同语音分片数据的高效数据传输。
附图说明
[0038]为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0039]图1中示例性示出了根据一些实施例的语音识别网络架构示意图;
[0040]图2中示例性示出了根据一些实施例的语音交互方法的流程示意图;
[0041]图3中示例性示出了根据一些实施例的语音交互方法的流程示意图;
[0042]图4中示例性示出了根据一些实施例的语音交互过程的时序示意图;
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种智能设备,其特征在于,包括:音频输入组件,用于接收用户音频,所述用户音频包括唤醒指令和语音流数据;控制器,分别与所述音频输入组件和音频输出组件连接,所述控制器被配置为:接收用户输入的唤醒指令,根据所述唤醒指令,与服务器建立websocket连接;接收所述用户输入的语音流数据,在所述语音流数据达到预设的分片限值时,将所述语音流数据设置为语音分片数据,设置所述语音分片数据的分片参数;封装包含所述语音分片数据和分片参数的TLV数据包;向服务器发送所述TLV数据包,以使所述服务器对所述TLV数据包进行解析,得到响应数据;根据服务器反馈的响应数据进行响应。2.根据权利要求1所述的智能设备,其特征在于,封装包含所述语音分片数据和分片参数的TLV数据包,包括:封装包含所述语音分片数据、分片参数和会话标识的TLV数据包,其中,所述会话标识与所述websocket连接相对应,用于将所述服务器反馈的包含所述会话标识的响应数据确定为所述TLV数据包的响应数据。3.根据权利要求2所述的智能设备,其特征在于,封装包含所述语音分片数据和分片参数的TLV数据包,包括:按照所述数据类型、数据长度、数据内容的格式生成所述会话标识对应的TLV数据。4.根据权利要求1所述的智能设备,其特征在于,封装包含所述语音分片数据和分片参数的TLV数据包,包括:按照数据类型、数据长度、数据内容的格式生成所述语音分片数据对应的TLV数据;按照所述数据类型、数据长度、数据内容的格式生成所述分片参数对应的TLV数据;按照校验位、状态位、总数据长度的格式生成包头,其中,所述总数据长度为全部TLV数据中的数据长度的和值;封装包含所述包头,以及包含全部TLV数据的包体的TLV数据包。5.根据权利要求4所述的智能设备,其特征在于,按照数据类型、数据长度、数据内容的格式生成所述语音分片数据对应的TLV数据,包括:设置所述语音分片数据对应的数据类型表示pcm数据;计算所述语音分片数据对应的数据长度;设置所述语音分片数据对应的数据内容为所述语音分片数据;按照数据类型、数据长度、数据内容的格式组合成所述语音分片数据对应的TLV数据。6.根据权利要求4所述的智能设备,其特征在于,...

【专利技术属性】
技术研发人员:张爽雷将
申请(专利权)人:海信电子科技武汉有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1