实现智能语音AI功能的方法及装置制造方法及图纸

技术编号：21895681 阅读：32 留言：0更新日期：2019-08-17 16:00

本发明专利技术的目的是提供一种实现智能语音AI功能的方法及装置，本发明专利技术通过从设备端获取语音流数据，并将所述语音流数据发送至第三方语音AI服务器；接收所述第三方语音AI服务器识别所述语音流数据后反馈的对应的AI服务回复数据；对所述AI服务回复数据进行解析，得到AI服务文本数据和AI服务语音数据并发送给所述设备，能够实现非智能设备或老旧平台的设备，能够通过中转服务器迅速接入第三方语音AI服务器的语音AI服务功能，流畅使用智能语音服务，使智能语音服务能够在非智能设备上成功商用。中转服务器可根据需求切换第三方AI服务厂商，对设备无影响，无须设备重发固件版本。

Method and Device for Realizing AI Function of Intelligent Speech

全部详细技术资料下载

【技术实现步骤摘要】
实现智能语音AI功能的方法及装置
本专利技术涉及计算机领域，尤其涉及一种实现智能语音AI功能的方法及系统。
技术介绍
语音AI(人工智能，ArtificialIntelligence)技术，近几年突飞猛进的发展，各大智能设备均以搭载智能语音AI技术为卖点，然而智能设备上只是语音输入的入口，后端接入了大量云端AI服务。目前国内的语音AI服务提供商有很多，主流的有小米、百度、科大讯飞等厂商。这些厂商在提供接入服务时对设备的类型、平台、操作系统均有要求。大部分只提供了安卓、IOS、Linux等主流操作系统的SDK接入，其他非使用该操作系统的设备无机会接入，如何解决这些老旧平台的设备接入语音AI，成为急需解决一个实际问题。
技术实现思路
本专利技术的一个目的是提供一种实现智能语音AI功能的方法及装置。根据本专利技术的一个方面，提供了一种实现智能语音AI功能的方法，该方法包括：从设备端获取语音流数据，并将所述语音流数据发送至第三方语音AI服务器；接收所述第三方语音AI服务器识别所述语音流数据后反馈的对应的AI服务回复数据；对所述AI服务回复数据进行解析，得到AI服务文本数据和AI服务语音数据并发送给所述设备。进一步的，上述方法中，所述中转服务器为Linux操作系统的云端服务器，从设备端获取语音流数据，并将所述语音流数据发送至第三方语音AI服务器，包括：与设备建立长连接链路；通过所述长连接链路，从设备端获取各段压缩后的语音流数据，并将各段压缩后的语音流数据解压后，使用第三方语音AI服务器提供的Linux的SDK接入语音AI服务将解压后的语音流数据透传至第三方语音AI服务器...

【技术保护点】
1.一种在中转服务器端实现智能语音AI功能的方法，其中，该方法包括：从设备端获取语音流数据，并将所述语音流数据发送至第三方语音AI服务器；接收所述第三方语音AI服务器识别所述语音流数据后反馈的对应的AI服务回复数据；对所述AI服务回复数据进行解析，得到AI服务文本数据和AI服务语音数据并发送给所述设备。

【技术特征摘要】
1.一种在中转服务器端实现智能语音AI功能的方法，其中，该方法包括：从设备端获取语音流数据，并将所述语音流数据发送至第三方语音AI服务器；接收所述第三方语音AI服务器识别所述语音流数据后反馈的对应的AI服务回复数据；对所述AI服务回复数据进行解析，得到AI服务文本数据和AI服务语音数据并发送给所述设备。2.根据权利要求1所述的方法，其中，所述中转服务器为Linux操作系统的云端服务器，从设备端获取语音流数据，并将所述语音流数据发送至第三方语音AI服务器，包括：与设备建立长连接链路；通过所述长连接链路，从设备端获取各段压缩后的语音流数据，并将各段压缩后的语音流数据解压后，使用第三方语音AI服务器提供的Linux的SDK接入语音AI服务将解压后的语音流数据透传至第三方语音AI服务器，并维持所述长连接链路。3.根据权利要求2所述的方法，其中，对所述AI服务回复数据进行解析，得到AI服务文本数据和AI服务语音数据并发送给所述设备，包括：对所述AI服务回复数据进行解析，从中抽取出ASR语音识别结果、NLP语义理解结果和TTS语音合成结果；将所述ASR语音识别结果、NLP语义理解结果和TTS语音合成结果分别组包，并分段下发至所述设备。4.一种在设备端实现智能语音AI功能的方法，其中，该方法包括：录制用户输入的指令语音，将所述指令语音转换为语音流数据，并将所述语音流数据发送至中转服务器；接收所述中转服务器返回的AI服务文本数据和AI服务语音数据，其中，所述AI服务文本数据和AI服务语音数据由所述中转服务器解析第三方语音AI服务器返回的AI服务回复数据得到，所述语音流数据由所述中转服务器发送给所述第三方语音AI服务器，所述第三方语音AI服务器识别所述语音流数据后向所述中转服务器反馈对应的AI服务回复数据；基于所述AI服务文本数据进行对应的文本显示，AI服务语音数据进行对应的语音播报。5.根据权利要求4所述的方法，其中，当所述中转服务器为Linux操作系统的云端服务器时，录制用户输入段指令语音，将所述指令语音转换为语音流数据，并将所述语音流数据发送至中转服务器，包括：录制用户输入的指令语音，将所述指令语音转换为各段语音流数据；与所述中转服务器建立长连接链路；将各段语音流数据压缩后通过所述长连接链路发送至中转服务器，并维持长连接链路。6.根据权利要求5所述的方法，其中，接收所述中转服务器返回的AI服务文本数据和AI服务语音数据，包括：从所述中转服务器接收分别组包并分段下发的ASR语音识别结果、NLP语义理解结果和TTS语音合成结果，其...

【专利技术属性】
技术研发人员：曾景文，
申请(专利权)人：甄十信息科技上海有限公司，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人