实现智能语音AI功能的方法及装置制造方法及图纸

技术编号:21895681 阅读:32 留言:0更新日期:2019-08-17 16:00
本发明专利技术的目的是提供一种实现智能语音AI功能的方法及装置,本发明专利技术通过从设备端获取语音流数据,并将所述语音流数据发送至第三方语音AI服务器;接收所述第三方语音AI服务器识别所述语音流数据后反馈的对应的AI服务回复数据;对所述AI服务回复数据进行解析,得到AI服务文本数据和AI服务语音数据并发送给所述设备,能够实现非智能设备或老旧平台的设备,能够通过中转服务器迅速接入第三方语音AI服务器的语音AI服务功能,流畅使用智能语音服务,使智能语音服务能够在非智能设备上成功商用。中转服务器可根据需求切换第三方AI服务厂商,对设备无影响,无须设备重发固件版本。

Method and Device for Realizing AI Function of Intelligent Speech

【技术实现步骤摘要】
实现智能语音AI功能的方法及装置
本专利技术涉及计算机领域,尤其涉及一种实现智能语音AI功能的方法及系统。
技术介绍
语音AI(人工智能,ArtificialIntelligence)技术,近几年突飞猛进的发展,各大智能设备均以搭载智能语音AI技术为卖点,然而智能设备上只是语音输入的入口,后端接入了大量云端AI服务。目前国内的语音AI服务提供商有很多,主流的有小米、百度、科大讯飞等厂商。这些厂商在提供接入服务时对设备的类型、平台、操作系统均有要求。大部分只提供了安卓、IOS、Linux等主流操作系统的SDK接入,其他非使用该操作系统的设备无机会接入,如何解决这些老旧平台的设备接入语音AI,成为急需解决一个实际问题。
技术实现思路
本专利技术的一个目的是提供一种实现智能语音AI功能的方法及装置。根据本专利技术的一个方面,提供了一种实现智能语音AI功能的方法,该方法包括:从设备端获取语音流数据,并将所述语音流数据发送至第三方语音AI服务器;接收所述第三方语音AI服务器识别所述语音流数据后反馈的对应的AI服务回复数据;对所述AI服务回复数据进行解析,得到AI服务文本数据和AI服务语音数据并发送给所述设备。进一步的,上述方法中,所述中转服务器为Linux操作系统的云端服务器,从设备端获取语音流数据,并将所述语音流数据发送至第三方语音AI服务器,包括:与设备建立长连接链路;通过所述长连接链路,从设备端获取各段压缩后的语音流数据,并将各段压缩后的语音流数据解压后,使用第三方语音AI服务器提供的Linux的SDK接入语音AI服务将解压后的语音流数据透传至第三方语音AI服务器,并维持所述长连接链路。进一步的,上述方法中,对所述AI服务回复数据进行解析,得到AI服务文本数据和AI服务语音数据并发送给所述设备,包括:对所述AI服务回复数据进行解析,从中抽取出ASR语音识别结果、NLP语义理解结果和TTS语音合成结果;将所述ASR语音识别结果、NLP语义理解结果和TTS语音合成结果分别组包,并分段下发至所述设备。根据本专利技术的另一方面,还提供一种在设备端实现智能语音AI功能的方法,其中,该方法包括:录制用户输入的指令语音,将所述指令语音转换为语音流数据,并将所述语音流数据发送至中转服务器;接收所述中转服务器返回的AI服务文本数据和AI服务语音数据,其中,所述AI服务文本数据和AI服务语音数据由所述中转服务器解析第三方语音AI服务器返回的AI服务回复数据得到,所述语音流数据由所述中转服务器发送给所述第三方语音AI服务器,所述第三方语音AI服务器识别所述语音流数据后向所述中转服务器反馈对应的AI服务回复数据;基于所述AI服务文本数据进行对应的文本显示,AI服务语音数据进行对应的语音播报。进一步的,上述方法中,当所述中转服务器为Linux操作系统的云端服务器时,录制用户输入段指令语音,将所述指令语音转换为语音流数据,并将所述语音流数据发送至中转服务器,包括:录制用户输入的指令语音,将所述指令语音转换为各段语音流数据;与所述中转服务器建立长连接链路;将各段语音流数据压缩后通过所述长连接链路发送至中转服务器,并维持长连接链路。进一步的,上述方法中,接收所述中转服务器返回的AI服务文本数据和AI服务语音数据,包括:从所述中转服务器接收分别组包并分段下发的ASR语音识别结果、NLP语义理解结果和TTS语音合成结果,其中,所述中转服务器对所述AI服务回复数据进行解析,从中抽取出ASR语音识别结果、NLP语义理解结果和TTS语音合成结果;将所述ASR语音识别结果、NLP语义理解结果作为AI服务文本数据;将TTS语音合成结果作为AI服务语音数据。根据本专利技术的另一方面,还提供一种基于计算的装置,其中,包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:从设备端获取语音流数据,并将所述语音流数据发送至第三方语音AI服务器;接收所述第三方语音AI服务器识别所述语音流数据后反馈的对应的AI服务回复数据;对所述AI服务回复数据进行解析,得到AI服务文本数据和AI服务语音数据并发送给所述设备。根据本专利技术的另一方面,还提供一种计算机可读存储介质,其上存储有计算机可执行指令,其中,该计算机可执行指令被处理器执行时使得该处理器:从设备端获取语音流数据,并将所述语音流数据发送至第三方语音AI服务器;接收所述第三方语音AI服务器识别所述语音流数据后反馈的对应的AI服务回复数据;对所述AI服务回复数据进行解析,得到AI服务文本数据和AI服务语音数据并发送给所述设备。根据本专利技术的另一方面,还提供一种基于计算的装置,其中,包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:录制用户输入的指令语音,将所述指令语音转换为语音流数据,并将所述语音流数据发送至中转服务器;接收所述中转服务器返回的AI服务文本数据和AI服务语音数据,其中,所述AI服务文本数据和AI服务语音数据由所述中转服务器解析第三方语音AI服务器返回的AI服务回复数据得到,所述语音流数据由所述中转服务器发送给所述第三方语音AI服务器,所述第三方语音AI服务器识别所述语音流数据后向所述中转服务器反馈对应的AI服务回复数据;基于所述AI服务文本数据进行对应的文本显示,AI服务语音数据进行对应的语音播报。根据本专利技术的另一方面,还提供一种计算机可读存储介质,其上存储有计算机可执行指令,其中,该计算机可执行指令被处理器执行时使得该处理器:录制用户输入的指令语音,将所述指令语音转换为语音流数据,并将所述语音流数据发送至中转服务器;接收所述中转服务器返回的AI服务文本数据和AI服务语音数据,其中,所述AI服务文本数据和AI服务语音数据由所述中转服务器解析第三方语音AI服务器返回的AI服务回复数据得到,所述语音流数据由所述中转服务器发送给所述第三方语音AI服务器,所述第三方语音AI服务器识别所述语音流数据后向所述中转服务器反馈对应的AI服务回复数据;基于所述AI服务文本数据进行对应的文本显示,AI服务语音数据进行对应的语音播报。与现有技术相比,本专利技术通过从设备端获取语音流数据,并将所述语音流数据发送至第三方语音AI服务器;接收所述第三方语音AI服务器识别所述语音流数据后反馈的对应的AI服务回复数据;对所述AI服务回复数据进行解析,得到AI服务文本数据和AI服务语音数据并发送给所述设备,能够实现非智能设备或老旧平台的设备,能够通过中转服务器迅速接入第三方语音AI服务器的语音AI服务功能,流畅使用智能语音服务,使智能语音服务能够在非智能设备上成功商用。中转服务器可根据需求切换第三方AI服务厂商,对设备无影响,无须设备重发固件版本。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1示出根据本专利技术一实施例的实现智能语音AI功能的方法及装置的原理图;图2示出本专利技术一实施例的语音流数据的组包发送格式示意图。附图中相同或相似的附图标记代表相同或相似的部件。具体实施方式下面结合附图对本专利技术作进一步详细描述。在本申请一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个处理器(CPU)、输入/输本文档来自技高网...

【技术保护点】
1.一种在中转服务器端实现智能语音AI功能的方法,其中,该方法包括:从设备端获取语音流数据,并将所述语音流数据发送至第三方语音AI服务器;接收所述第三方语音AI服务器识别所述语音流数据后反馈的对应的AI服务回复数据;对所述AI服务回复数据进行解析,得到AI服务文本数据和AI服务语音数据并发送给所述设备。

【技术特征摘要】
1.一种在中转服务器端实现智能语音AI功能的方法,其中,该方法包括:从设备端获取语音流数据,并将所述语音流数据发送至第三方语音AI服务器;接收所述第三方语音AI服务器识别所述语音流数据后反馈的对应的AI服务回复数据;对所述AI服务回复数据进行解析,得到AI服务文本数据和AI服务语音数据并发送给所述设备。2.根据权利要求1所述的方法,其中,所述中转服务器为Linux操作系统的云端服务器,从设备端获取语音流数据,并将所述语音流数据发送至第三方语音AI服务器,包括:与设备建立长连接链路;通过所述长连接链路,从设备端获取各段压缩后的语音流数据,并将各段压缩后的语音流数据解压后,使用第三方语音AI服务器提供的Linux的SDK接入语音AI服务将解压后的语音流数据透传至第三方语音AI服务器,并维持所述长连接链路。3.根据权利要求2所述的方法,其中,对所述AI服务回复数据进行解析,得到AI服务文本数据和AI服务语音数据并发送给所述设备,包括:对所述AI服务回复数据进行解析,从中抽取出ASR语音识别结果、NLP语义理解结果和TTS语音合成结果;将所述ASR语音识别结果、NLP语义理解结果和TTS语音合成结果分别组包,并分段下发至所述设备。4.一种在设备端实现智能语音AI功能的方法,其中,该方法包括:录制用户输入的指令语音,将所述指令语音转换为语音流数据,并将所述语音流数据发送至中转服务器;接收所述中转服务器返回的AI服务文本数据和AI服务语音数据,其中,所述AI服务文本数据和AI服务语音数据由所述中转服务器解析第三方语音AI服务器返回的AI服务回复数据得到,所述语音流数据由所述中转服务器发送给所述第三方语音AI服务器,所述第三方语音AI服务器识别所述语音流数据后向所述中转服务器反馈对应的AI服务回复数据;基于所述AI服务文本数据进行对应的文本显示,AI服务语音数据进行对应的语音播报。5.根据权利要求4所述的方法,其中,当所述中转服务器为Linux操作系统的云端服务器时,录制用户输入段指令语音,将所述指令语音转换为语音流数据,并将所述语音流数据发送至中转服务器,包括:录制用户输入的指令语音,将所述指令语音转换为各段语音流数据;与所述中转服务器建立长连接链路;将各段语音流数据压缩后通过所述长连接链路发送至中转服务器,并维持长连接链路。6.根据权利要求5所述的方法,其中,接收所述中转服务器返回的AI服务文本数据和AI服务语音数据,包括:从所述中转服务器接收分别组包并分段下发的ASR语音识别结果、NLP语义理解结果和TTS语音合成结果,其...

【专利技术属性】
技术研发人员:曾景文
申请(专利权)人:甄十信息科技上海有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1