The invention discloses a voice service method, a system, an electronic device and a storage medium, wherein the method includes: receiving voice requests initiated by a terminal device; determining text content for responding to the voice requests; at least transmitting the text content to the terminal device; and combining the text content based on the said text content. The resulting audio data is transmitted to the terminal device. In the method of the embodiment of the present invention, since the time consumed to determine the corresponding text content based on the voice request is much shorter than the time consumed to synthesize the corresponding audio data based on the text content, the method of the embodiment of the present invention responds to the user request in the form of text content and audio successively. It can ensure timely response to user requests, avoid long waiting time and improve user experience.
【技术实现步骤摘要】
语音服务方法、系统、电子设备及存储介质
本专利技术涉及语音识别
,尤其涉及语音服务方法、系统、电子设备及存储介质。
技术介绍
随着语音识别技术的不断发展,越来越多的成熟的语音服务产品为用户提供者便捷的语音服务,例如,各种语音助手的出现,使得用户查询获取信息的形式不再仅仅限于手动输入进行查询,可以直接进行语音输入来查询获取所需内容,相应的所获得的内容也不再仅仅限于传统的图文形式,还能够同时获得音频形式的信息。然而,由于受合成音频数据的合成算法的效率的影响,在为用户提供同步的图文和音频信息时,往往会造成较长的延时。例如,亚马逊的AVS(AlexaVoiceService亚马逊智能对话服务)云端对话采用文本回复和语音回复结合的方式,云端先计算得到文本回复,但是文本回复要等合成计算返回语音回复后再一起向用户终端设备返回。这样做,从用户视角看,会造成从发送完语音请求到收到回复消息这之间的延时偏大。为解决音频数据的合成算法所带来的延时问题,相关技术专家进行了越来越多的关于音频数据合成算法的优化方法的研究,但最终效果始终不够理想。
技术实现思路
本专利技术实施例提供一种语音服务方法、系统、电子设备及存储介质,用于至少解决上述技术问题之一。第一方面,本专利技术实施例提供一种语音服务方法,包括:接收终端设备所发起的语音请求;确定用于响应所述语音请求的文本内容;至少发送所述文本内容至所述终端设备;将基于所述文本内容所合成的音频数据发送至所述终端设备。第二方面,本专利技术实施例提供另一种语音服务方法,包括:发送语音请求至云端服务器;至少接收所述云端服务器所发送的用于响应所述语 ...
【技术保护点】
1.一种语音服务方法,包括:接收终端设备所发起的语音请求;确定用于响应所述语音请求的文本内容;至少发送所述文本内容至所述终端设备;将基于所述文本内容所合成的音频数据发送至所述终端设备。
【技术特征摘要】
1.一种语音服务方法,包括:接收终端设备所发起的语音请求;确定用于响应所述语音请求的文本内容;至少发送所述文本内容至所述终端设备;将基于所述文本内容所合成的音频数据发送至所述终端设备。2.根据权利要求1所述的方法,其中,在发送所述文本内容至所述终端设备之后还包括:接收所述终端设备所发送的音频数据获取请求,所述音频数据获取请求中包括所述文本内容;解析所述音频数据获取请求以确定所述文本内容;基于所述文本内容合成相应的音频数据。3.根据权利要求1所述的方法,其中,在确定用于响应所述语音请求的文本内容之后还包括:启动基于所述文本内容合成音频数据的合成步骤并生成用于获取所述音频数据的音频数据下载地址;所述至少发送所述文本内容至所述终端设备包括:将所述文本内容和所述音频数据下载地址发送至所述终端设备。4.根据权利要求3所述的方法,其中,所述将基于所述文本内容所合成的音频数据发送至所述终端设备包括:接收所述终端设备所发送的音频数据获取请求,所述音频数据获取请求中包括所述音频数据下载地址;根据所述音频数据下载地址获取从启动所述合成步骤起至当前时刻所缓存的相应的音频数据;将所述音频数据发送至所述终端设备。5.根据权利要求3所述的方法,其中,所述将基于所述文本内容所合成的音频数据发送至所述终端设备包括:接收所述终端设备所发送的音频数据获取请求,所述音频数据获取请求中包括所述音频数据下载地址;判断是否为第一次接收到所述音频数据下载地址所对应的音频数据获取请求;如果是,则根据所述音频数据下载地址获取从启动所述合成步骤起至当前时刻所缓存的相应的音频数据;将所述音频数据发送至所述终端设备。6.根据权利要求4所述的方法,其中,还包括:当启动所述合成步骤并完成所述音频数据的合成之后开始计时;当计时时长超过预设阈值时删除所述音频数据。7.一种语音服务方法,包括:发送语音请求至云端服务器;至少接收所述云端服务器所发送的用于响应所述语音请求的文本内容;接收所述云端服务器基于所述文本内容所合成的音频数据。8.根据权利要求7所述的方法,其中,在接收所述云端服务器所发送的用于响应所述语音请求的文本内容之后还包括:发送音频数据获取...
【专利技术属性】
技术研发人员:吴旺,张顺,龚建明,
申请(专利权)人:苏州思必驰信息科技有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。