语音服务方法、系统、电子设备及存储介质技术方案

技术编号:19553978 阅读:23 留言:0更新日期:2018-11-24 22:28
本发明专利技术公开一种语音服务方法、系统、电子设备及存储介质,其中,所述方法包括:接收终端设备所发起的语音请求;确定用于响应所述语音请求的文本内容;至少发送所述文本内容至所述终端设备;将基于所述文本内容所合成的音频数据发送至所述终端设备。本发明专利技术实施例的方法中,因为基于语音请求确定相应的文本内容所消耗的时间,相对于基于文本内容合成相应的音频数据所消耗的时间要短很多,所以,本发明专利技术实施例的方法采用先后以文本内容形式和音频形式响应用户请求的能够保证对用户请求的及时应答,避免用户等待时间过长,提升用户体验。

Voice service methods, systems, electronic devices and storage media

The invention discloses a voice service method, a system, an electronic device and a storage medium, wherein the method includes: receiving voice requests initiated by a terminal device; determining text content for responding to the voice requests; at least transmitting the text content to the terminal device; and combining the text content based on the said text content. The resulting audio data is transmitted to the terminal device. In the method of the embodiment of the present invention, since the time consumed to determine the corresponding text content based on the voice request is much shorter than the time consumed to synthesize the corresponding audio data based on the text content, the method of the embodiment of the present invention responds to the user request in the form of text content and audio successively. It can ensure timely response to user requests, avoid long waiting time and improve user experience.

【技术实现步骤摘要】
语音服务方法、系统、电子设备及存储介质
本专利技术涉及语音识别
,尤其涉及语音服务方法、系统、电子设备及存储介质。
技术介绍
随着语音识别技术的不断发展,越来越多的成熟的语音服务产品为用户提供者便捷的语音服务,例如,各种语音助手的出现,使得用户查询获取信息的形式不再仅仅限于手动输入进行查询,可以直接进行语音输入来查询获取所需内容,相应的所获得的内容也不再仅仅限于传统的图文形式,还能够同时获得音频形式的信息。然而,由于受合成音频数据的合成算法的效率的影响,在为用户提供同步的图文和音频信息时,往往会造成较长的延时。例如,亚马逊的AVS(AlexaVoiceService亚马逊智能对话服务)云端对话采用文本回复和语音回复结合的方式,云端先计算得到文本回复,但是文本回复要等合成计算返回语音回复后再一起向用户终端设备返回。这样做,从用户视角看,会造成从发送完语音请求到收到回复消息这之间的延时偏大。为解决音频数据的合成算法所带来的延时问题,相关技术专家进行了越来越多的关于音频数据合成算法的优化方法的研究,但最终效果始终不够理想。
技术实现思路
本专利技术实施例提供一种语音服务方法、系统、电子设备及存储介质,用于至少解决上述技术问题之一。第一方面,本专利技术实施例提供一种语音服务方法,包括:接收终端设备所发起的语音请求;确定用于响应所述语音请求的文本内容;至少发送所述文本内容至所述终端设备;将基于所述文本内容所合成的音频数据发送至所述终端设备。第二方面,本专利技术实施例提供另一种语音服务方法,包括:发送语音请求至云端服务器;至少接收所述云端服务器所发送的用于响应所述语音请求的文本内容;接收所述云端服务器基于所述文本内容所合成的音频数据。第三方面,本专利技术实施例提供一种语音服务系统,包括:中控节点,用于接收终端设备所发起的语音请求;文本内容确定节点,用于接收所述中控节点所分配的语音请求,并确定用于响应所述语音请求的文本内容,以用于所述中控节点至少发送所述文本内容至所述终端设备;音频数据合成节点,用于基于所述文本内容合成相应的音频数据,所述中控节点还用于将基于所述文本内容所合成的音频数据发送至所述终端设备。第四方面,本专利技术实施例提供一种存储介质,所述存储介质中存储有一个或多个包括执行指令的程序,所述执行指令能够被电子设备(包括但不限于计算机,服务器,或者网络设备等)读取并执行,以用于执行本专利技术上述任一项语音服务方法。第五方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术上述任一项语音服务方法。第六方面,本专利技术实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述任一项语音服务方法。本专利技术实施例的有益效果在于:相对于现有技术,本专利技术实施例的方法在提供语音服务时可以首先以文本内容的形式响应用户通过终端设备所发起的语音请求,进而在基于文本内容确定相应的音频数据之后进一步提供给用户。因为基于语音请求确定相应的文本内容所消耗的时间,相对于基于文本内容合成相应的音频数据所消耗的时间要短很多,所以,本专利技术实施例的方法采用先后以文本内容形式和音频形式响应用户请求的能够保证对用户请求的及时应答,避免用户等待时间过长,提升用户体验。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术的语音服务方法的一种实施例的流程图;图2为本专利技术的语音服务方法的一种实施例的流程图;图3为本专利技术的语音服务方法的一种实施例的流程图;图4为本专利技术的语音服务方法的一种实施例的流程图;图5为本专利技术的语音服务方法的一种实施例的流程图;图6为本专利技术的语音服务方法的一种实施例的流程图;图7为本专利技术的语音服务方法的一种实施例的流程图;图8为本专利技术的语音服务系统的一种实施例的原理框图;图9为本专利技术的电子设备的一种实施例的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。本专利技术可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、元件、数据结构等等。也可以在分布式计算环境中实践本专利技术,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。在本专利技术中,“模块”、“装置”、“系统”等指应用于计算机的相关实体,如硬件、硬件和软件的组合、软件或执行中的软件等。详细地说,例如,元件可以、但不限于是运行于处理器的过程、处理器、对象、可执行元件、执行线程、程序和/或计算机。还有,运行于服务器上的应用程序或脚本程序、服务器都可以是元件。一个或多个元件可在执行的过程和/或线程中,并且元件可以在一台计算机上本地化和/或分布在两台或多台计算机之间,并可以由各种计算机可读介质运行。元件还可以根据具有一个或多个数据包的信号,例如,来自一个与本地系统、分布式系统中另一元件交互的,和/或在因特网的网络通过信号与其它系统交互的数据的信号通过本地和/或远程过程来进行通信。最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”,不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。如图1所示,本专利技术的实施例提供一种语音服务方法,本专利技术实施例的方法应用于服务器或者服务器集群(例如,云端服务器),该方法包括:S11、接收终端设备所发起的语音请求;其中,终端设备可以是智能手机、平板电脑、PC机等任何智能终端或者电子设备。用户可以通过安装在智能手机上的语音助手发起语音请求,例如,用户可以通过语音助手询问“北京明天的天气怎么样?”,智能手机通过麦克收音后将用户询问发送给云端服务器,即,云端服务器接收用户通过智能手机所发起的语音请求。S12、确定用于响应所述语音请求的文本内容;其中,在云端服务器接收到语音请求的音频数据后,对该音频数据进行语音识别得到对应的识别文本内容,然后对该识别文本内容进行本文档来自技高网...

【技术保护点】
1.一种语音服务方法,包括:接收终端设备所发起的语音请求;确定用于响应所述语音请求的文本内容;至少发送所述文本内容至所述终端设备;将基于所述文本内容所合成的音频数据发送至所述终端设备。

【技术特征摘要】
1.一种语音服务方法,包括:接收终端设备所发起的语音请求;确定用于响应所述语音请求的文本内容;至少发送所述文本内容至所述终端设备;将基于所述文本内容所合成的音频数据发送至所述终端设备。2.根据权利要求1所述的方法,其中,在发送所述文本内容至所述终端设备之后还包括:接收所述终端设备所发送的音频数据获取请求,所述音频数据获取请求中包括所述文本内容;解析所述音频数据获取请求以确定所述文本内容;基于所述文本内容合成相应的音频数据。3.根据权利要求1所述的方法,其中,在确定用于响应所述语音请求的文本内容之后还包括:启动基于所述文本内容合成音频数据的合成步骤并生成用于获取所述音频数据的音频数据下载地址;所述至少发送所述文本内容至所述终端设备包括:将所述文本内容和所述音频数据下载地址发送至所述终端设备。4.根据权利要求3所述的方法,其中,所述将基于所述文本内容所合成的音频数据发送至所述终端设备包括:接收所述终端设备所发送的音频数据获取请求,所述音频数据获取请求中包括所述音频数据下载地址;根据所述音频数据下载地址获取从启动所述合成步骤起至当前时刻所缓存的相应的音频数据;将所述音频数据发送至所述终端设备。5.根据权利要求3所述的方法,其中,所述将基于所述文本内容所合成的音频数据发送至所述终端设备包括:接收所述终端设备所发送的音频数据获取请求,所述音频数据获取请求中包括所述音频数据下载地址;判断是否为第一次接收到所述音频数据下载地址所对应的音频数据获取请求;如果是,则根据所述音频数据下载地址获取从启动所述合成步骤起至当前时刻所缓存的相应的音频数据;将所述音频数据发送至所述终端设备。6.根据权利要求4所述的方法,其中,还包括:当启动所述合成步骤并完成所述音频数据的合成之后开始计时;当计时时长超过预设阈值时删除所述音频数据。7.一种语音服务方法,包括:发送语音请求至云端服务器;至少接收所述云端服务器所发送的用于响应所述语音请求的文本内容;接收所述云端服务器基于所述文本内容所合成的音频数据。8.根据权利要求7所述的方法,其中,在接收所述云端服务器所发送的用于响应所述语音请求的文本内容之后还包括:发送音频数据获取...

【专利技术属性】
技术研发人员:吴旺张顺龚建明
申请(专利权)人:苏州思必驰信息科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1